Функция Excel CORREL - Изчислете статистическа корелация

Изтеглете Примерна работна книга

Изтеглете примерната работна книга

Този урок демонстрира как да използвате Функция Excel CORREL в Excel за изчисляване на корелацията.

Преглед на функцията CORREL

Функцията CORREL Изчислява корелацията на две серии от числа.

За да използвате функцията CORREL Excel на работен лист, изберете клетка и въведете:

(Забележете как се появяват входовете на формулата)

Функция CORREL Синтаксис и входове:

1 = CORREL (масив1, масив2)

масив1 - масиви от числа.

Какво представлява функцията CORREL?

Функцията Excel CORREL връща коефициента на корелация (Pearson’s r) от два диапазона от данни.

Какъв е коефициентът на корелация?

Коефициентът на корелация, обикновено наричан този на Пиърсън r (кръстен на Карл Пиърсън, човекът, който го е разработил), е статистика, която ви казва колко силно са свързани две променливи.

Пиърсън r е цифра между -1 и 1, което може да доведе до три възможни интерпретации: положителна корелация, отрицателна корелация и липса на корелация.

Положителна корелация

Положителна корелация (r > 0) означава, че когато двете променливи са в тандем - когато наблюдавате висок резултат в едната променлива, вие сте склонни да наблюдавате и висок резултат в другата. По същия начин, когато една променлива е ниска, другата също е ниска.

Например, ръстът и теглото имат положителна връзка. Вижте диаграмата по -долу, която показва височината и теглото на малка извадка от бейзболни играчи:

The r от тази малка извадка е 0,73 - много силна положителна корелация. Това има логичен смисъл - по -високите хора са средно по -тежки, тъй като тази допълнителна височина се състои от кости и мускули и друга тъкан, която всички тежат нещо.

Но корелацията не е перфектна (в перфектна корелация с an r от 1, всички резултати ще попаднат на линията на тренда). Някои по -ниски хора могат да бъдат по -тежки - може би носят малко повече мазнини или тренират във фитнеса. По същия начин някои високи хора може да са много слаби и всъщност тежат по -малко от много по -ниски хора.

Корелацията тук вероятно е толкова висока, защото имаме работа със спортисти, тя би била по -ниска в общата популация. Не забравяйте да имате предвид това, когато използвате CORREL - r получавате не е окончателно - трябва да помислите какви са вашите данни и как сте ги получили, когато правите своите интерпретации.

Отрицателна корелация

Отрицателна корелация (r <0) означава, че когато наблюдавате висок резултат в една променлива, сте склонни да наблюдавате нисък резултат в другата променлива и обратно.

Например резултатите от тестовете на учениците и броят отсъствия, които са имали в училище, са отрицателно свързани. Тоест колкото повече дни пропускат, толкова по -ниски са резултатите им. Колкото по -малко дни пропускат, толкова по -високи са резултатите:

Отново, връзката не е перфектна (както почти никога не са). Тук имаме един студент, който пропусна 5 дни, но все пак успя да вкара 85%. Имаме и един, който отбеляза 52%, въпреки че липсваше само два дни.

Все още имаме явна негативна тенденция. Но все още има много вариации в резултатите от тестовете, които не могат да бъдат обяснени само с отсъствието. Това може да се дължи на други променливи, като способност, мотивация, здраве и много други потенциални фактори.

Така че, когато използвате CORREL, имайте предвид, че има по -голяма картина, която данните ви може да не обясняват напълно.

Няма корелация

Няма корелация (r = 0 или е близо до 0) означава, че не можете да предвидите оценката на една променлива въз основа на друга. Ако начертаете данните, няма да видите забележима тенденция, а линията на тренда ще бъде равна или почти плоска.

Ето някои данни за дължината на безименния пръст и коефициента на интелигентност:

Както можете да видите, няма връзка между тези две променливи в тази извадка, така че можем да приемем, че те не са свързани.

На практика едва ли ще получите r на точно 0. Не забравяйте, че при събирането на данни често има някои вариации поради грешка, може би при измерване или отчитане. Така че просто защото си r не е точно 0, не означава, че сте намерили нещо.

Корелацията не е причинно -следствена връзка

От решаващо значение е да имате предвид, че CORREL не може да ви каже коя променлива влияе върху другата - или дори дали изобщо има някаква причинно -следствена връзка между променливите. Например, намерена е корелация между следните променливи:

  • Количеството продаден сладолед и количеството насилствени престъпления
  • Колко сте щастливи и колко сте успешни в кариерата си
  • Броят на удавените хора в басейн и броят на филмите на Николас Кейдж на година

Първият пример е трети променлив проблем. Разбира се, сладоледът не прави хората насилствени, нито упражняването на насилие предизвиква жажда за замразено мляко и захар. Третата променлива е времето. При горещо време хората просто излизат повече - има повече контакти между хората и така повече шанс за конфликт. При горещо време хората също купуват повече сладолед. Така че продажбите на сладолед и насилствената престъпност корелират само защото и двете са свързани с трета променлива.

Второто може да бъде пример за двойна причинност. Успехът на работното място може да бъде добър за щастието ви - ще спечелите повече пари и като цяло ще имате по -голям контрол върху това, което работите и с кого го вършите. Но щастието може да бъде от полза и за успеха, може би по -щастливите хора са по -лесни за разбиране и развиване на по -силни работни отношения, или може би са по -устойчиви психически на неуспехи. В този случай и двете променливи се влияят взаимно.

Третият е просто а фалшива корелация. Това, че две променливи корелират във вашите данни, не означава, че те взаимодействат в реалния живот.

В крайна сметка, корелацията не може да ви каже дали две променливи са причинно свързани.

Как да използвате CORREL

Използвайте функцията Excel CORREL по следния начин:

1 = CORREL (B3: B15, C3: C15)

С CORREL дефинирате два аргумента - двата диапазона от данни, които искате да съпоставите.

Ето няколко ключови точки, които трябва да имате предвид с CORREL:

  • Текст, булева стойност (TRUE/FALSE) и празни клетки се игнорират.
  • И двата диапазона от данни трябва да имат равен брой точки от данни, в противен случай ще получите грешка #N/A
  • Ако един от диапазоните от данни е празен, или ако изобщо няма промяна в данните (т.е. ако всички точки от данни са еднакви), ще получите #DIV/0! Грешка

Функция CORREL в Google Таблици

Функцията CORREL работи абсолютно същото в Google Sheets като в Excel:

допълнителни бележки

CORREL Примери във VBA

Можете също да използвате функцията CORREL във VBA. Тип:
application.worksheetfunction.correl (масив1, масив2)
За аргументите на функцията (масив1 и т.н.) можете или да ги въведете директно във функцията, или да определите променливи, които да използвате вместо тях.

Връщане към списъка с всички функции в Excel

wave wave wave wave wave