- Преглед на функцията CORREL
- Функция CORREL Синтаксис и входове:
- Какво представлява функцията CORREL?
- Какъв е коефициентът на корелация?
- Положителна корелация
- Отрицателна корелация
- Няма корелация
- Корелацията не е причинно -следствена връзка
- Как да използвате CORREL
- Функция CORREL в Google Таблици
- допълнителни бележки
- CORREL Примери във VBA
Изтеглете примерната работна книга
Този урок демонстрира как да използвате Функция Excel CORREL в Excel за изчисляване на корелацията.
Преглед на функцията CORREL
Функцията CORREL Изчислява корелацията на две серии от числа.
За да използвате функцията CORREL Excel на работен лист, изберете клетка и въведете:
(Забележете как се появяват входовете на формулата)
Функция CORREL Синтаксис и входове:
1 | = CORREL (масив1, масив2) |
масив1 - масиви от числа.
Какво представлява функцията CORREL?
Функцията Excel CORREL връща коефициента на корелация (Pearson’s r) от два диапазона от данни.
Какъв е коефициентът на корелация?
Коефициентът на корелация, обикновено наричан този на Пиърсън r (кръстен на Карл Пиърсън, човекът, който го е разработил), е статистика, която ви казва колко силно са свързани две променливи.
Пиърсън r е цифра между -1 и 1, което може да доведе до три възможни интерпретации: положителна корелация, отрицателна корелация и липса на корелация.
Положителна корелация
Положителна корелация (r > 0) означава, че когато двете променливи са в тандем - когато наблюдавате висок резултат в едната променлива, вие сте склонни да наблюдавате и висок резултат в другата. По същия начин, когато една променлива е ниска, другата също е ниска.
Например, ръстът и теглото имат положителна връзка. Вижте диаграмата по -долу, която показва височината и теглото на малка извадка от бейзболни играчи:
The r от тази малка извадка е 0,73 - много силна положителна корелация. Това има логичен смисъл - по -високите хора са средно по -тежки, тъй като тази допълнителна височина се състои от кости и мускули и друга тъкан, която всички тежат нещо.
Но корелацията не е перфектна (в перфектна корелация с an r от 1, всички резултати ще попаднат на линията на тренда). Някои по -ниски хора могат да бъдат по -тежки - може би носят малко повече мазнини или тренират във фитнеса. По същия начин някои високи хора може да са много слаби и всъщност тежат по -малко от много по -ниски хора.
Корелацията тук вероятно е толкова висока, защото имаме работа със спортисти, тя би била по -ниска в общата популация. Не забравяйте да имате предвид това, когато използвате CORREL - r получавате не е окончателно - трябва да помислите какви са вашите данни и как сте ги получили, когато правите своите интерпретации.
Отрицателна корелация
Отрицателна корелация (r <0) означава, че когато наблюдавате висок резултат в една променлива, сте склонни да наблюдавате нисък резултат в другата променлива и обратно.
Например резултатите от тестовете на учениците и броят отсъствия, които са имали в училище, са отрицателно свързани. Тоест колкото повече дни пропускат, толкова по -ниски са резултатите им. Колкото по -малко дни пропускат, толкова по -високи са резултатите:
Отново, връзката не е перфектна (както почти никога не са). Тук имаме един студент, който пропусна 5 дни, но все пак успя да вкара 85%. Имаме и един, който отбеляза 52%, въпреки че липсваше само два дни.
Все още имаме явна негативна тенденция. Но все още има много вариации в резултатите от тестовете, които не могат да бъдат обяснени само с отсъствието. Това може да се дължи на други променливи, като способност, мотивация, здраве и много други потенциални фактори.
Така че, когато използвате CORREL, имайте предвид, че има по -голяма картина, която данните ви може да не обясняват напълно.
Няма корелация
Няма корелация (r = 0 или е близо до 0) означава, че не можете да предвидите оценката на една променлива въз основа на друга. Ако начертаете данните, няма да видите забележима тенденция, а линията на тренда ще бъде равна или почти плоска.
Ето някои данни за дължината на безименния пръст и коефициента на интелигентност:
Както можете да видите, няма връзка между тези две променливи в тази извадка, така че можем да приемем, че те не са свързани.
На практика едва ли ще получите r на точно 0. Не забравяйте, че при събирането на данни често има някои вариации поради грешка, може би при измерване или отчитане. Така че просто защото си r не е точно 0, не означава, че сте намерили нещо.
Корелацията не е причинно -следствена връзка
От решаващо значение е да имате предвид, че CORREL не може да ви каже коя променлива влияе върху другата - или дори дали изобщо има някаква причинно -следствена връзка между променливите. Например, намерена е корелация между следните променливи:
- Количеството продаден сладолед и количеството насилствени престъпления
- Колко сте щастливи и колко сте успешни в кариерата си
- Броят на удавените хора в басейн и броят на филмите на Николас Кейдж на година
Първият пример е трети променлив проблем. Разбира се, сладоледът не прави хората насилствени, нито упражняването на насилие предизвиква жажда за замразено мляко и захар. Третата променлива е времето. При горещо време хората просто излизат повече - има повече контакти между хората и така повече шанс за конфликт. При горещо време хората също купуват повече сладолед. Така че продажбите на сладолед и насилствената престъпност корелират само защото и двете са свързани с трета променлива.
Второто може да бъде пример за двойна причинност. Успехът на работното място може да бъде добър за щастието ви - ще спечелите повече пари и като цяло ще имате по -голям контрол върху това, което работите и с кого го вършите. Но щастието може да бъде от полза и за успеха, може би по -щастливите хора са по -лесни за разбиране и развиване на по -силни работни отношения, или може би са по -устойчиви психически на неуспехи. В този случай и двете променливи се влияят взаимно.
Третият е просто а фалшива корелация. Това, че две променливи корелират във вашите данни, не означава, че те взаимодействат в реалния живот.
В крайна сметка, корелацията не може да ви каже дали две променливи са причинно свързани.
Как да използвате CORREL
Използвайте функцията Excel CORREL по следния начин:
1 | = CORREL (B3: B15, C3: C15) |
С CORREL дефинирате два аргумента - двата диапазона от данни, които искате да съпоставите.
Ето няколко ключови точки, които трябва да имате предвид с CORREL:
- Текст, булева стойност (TRUE/FALSE) и празни клетки се игнорират.
- И двата диапазона от данни трябва да имат равен брой точки от данни, в противен случай ще получите грешка #N/A
- Ако един от диапазоните от данни е празен, или ако изобщо няма промяна в данните (т.е. ако всички точки от данни са еднакви), ще получите #DIV/0! Грешка
Функция CORREL в Google Таблици
Функцията CORREL работи абсолютно същото в Google Sheets като в Excel:
допълнителни бележки
CORREL Примери във VBA
Можете също да използвате функцията CORREL във VBA. Тип:application.worksheetfunction.correl (масив1, масив2)
За аргументите на функцията (масив1 и т.н.) можете или да ги въведете директно във функцията, или да определите променливи, които да използвате вместо тях.
Връщане към списъка с всички функции в Excel