Як розрахувати коефіцієнт лінійної кореляції пірсона
Коефіцієнт лінійної кореляції Пірсона дозволяє оцінити лінійну залежність між двома змінними (позначимо їх x і y). Розглянемо приклад з області економіки: припустимо, ви володієте рестораном. Для кожного десятого відвідувача ви записуєте час, проведений ним у вашому ресторані (x, хвилини) і витрачену ним суму (y, рублі). Чи є вірним те, що ті, хто довше засиджується в ресторані, залишають в ньому більше грошей? У цьому випадку між двома змінними буде спостерігатися позитивна кореляція. Або навпаки, чим багатша клієнт, тим менше часу він витрачає на обід? В такому випадку буде спостерігатися негативна кореляція. Щоб пролити світло на це питання, ви можете вирахувати коефіцієнт лінійної кореляції r, відомий також як коефіцієнт кореляції Пірсона.
Зміст
Примітка: У статті наведено формули, що використовуються в лінійному методі найменших квадратів, що дозволяють апроксимувати набір точок на площині прямою лінією.
Відео: КОРЕЛЯЦІЯ Спірмена Пірсона STATISTICA # 08
кроки
Відео: Результати розрахунку коефіцієнта кореляції Пірсона в SPSS
r = ssxy/ (Ssxx* ssyy) ** 0,5 = 59,8 / (11,2 * 359,2) ** 0,5 = 0,9428
Поради
- Завжди будуйте графік з нанесеними на нього точками. В іншому випадку ви можете втратити закономірність, оскільки коефіцієнт лінійної кореляції враховує для передбачення значень y за значеннями x лише пряму лінію.
- Ось чому багато анкети містять практично повторювані питання, відповіді на які навіюють нудьгу. Укладачі таких анкет знають безліч відомостей про питання x і питанні y окремо, але вони не мають ні найменшого уявлення, як ці питання корелюють, тобто взаємопов`язані один з одним.
попередження
- Перед тим як стверджувати, що дві змінні взаємопов`язані, перевірте, чи є значення обчисленого коефіцієнта кореляції статистично значущим. Іншими словами, чи не вийшло дане значення в результаті простого збігу. Наприклад, буває так, що всі точки лягають на одну пряму лінію, коефіцієнт дорівнює +1 або -1, але все одно кореляція виглядає непереконливо. Якщо коефіцієнт кореляції не є статистично значущим, не має сенсу наводити його значення.
- Якщо кореляція статистично значуща, це все одно не означає, що одна змінна однозначно "залежить" від іншої. Це доводить лише те, що за відомими значеннями змінної x можна з певною часткою ймовірності передбачити відповідні значення y, і навпаки.