Кореляційно-регресійний аналіз
Кореляційно-регресійний аналіз – це побудова та аналіз економіко-математичної моделі у вигляді рівняння регресії (рівняння кореляційного зв’язку), що виражає залежність результативної ознаки від однієї або кількох ознак-факторів і дає оцінку міри щільності зв’язку.
Основні ідеї теорії кореляції вперше висунув англійський учений Ф. Гальтон наприкінці 70-х XIX ст.. Досліджуючи закономірності спадковості, він виявив, що кількісні ознаки батьків у дітей пом’якшувалися, «повертали» до середніх величин за сукупністю. Такий зв’язок учений назвав «регресією». Цей термін закріпився за рівнянням, яке дає змогу за величиною однієї кореляційно пов’язаної ознаки розраховувати середні величини іншої.
Розвинув теорію кореляції учень Гальтона К. Пірсон, який використовував коефіцієнт кореляції як вимірник щільності зв’язку. Він розробив методи аналізу взаємозв’язку двох змінних, теорію часткових і чистих коефіцієнтів кореляції, теорію багатофакторної кореляції. Свій внесок у розвиток математичної статистики зробили Р. Фішер та учень Пірсоа В. Госсет (псевдонім Стьюдент). Логічні й математичні питання теорії кореляції вивчав український математик-економіст Є. Слуцький.
Правильне застосування кореляційних методів дає змогу зрозуміти глибинну сутність процесів взаємозв’язків. Кореляційні зв’язки виявляються не в кожному окремому випадку, а в середньому для багатьох випадків. У цих зв’язках між причиною і наслідком немає повної відповідності, а спостерігається лише певне співвідношення. Особливості кореляційних зв’язків породжують у теорії кореляції два завдання визначити теоретичну форму зв’язку (регресійний аналіз) і виміряти щільність зв’язку (кореляційний аналіз). Перше полягає в тому, щоб знайти форму функціонального зв’язку, яка найбільшою мірою відповідає суті кореляційної залежності. Друге – виміряти за допомогою спеціальних показників, якою мірою кореляційний зв’язок наближається до зв’язку функціонального.
Кореляційно-регресійний аналіз складається з таких етапів:
- попередній (апріорний) аналіз,
- збирання інформації та її первинна обробка,
- побудова моделі (рівняння регресії),
- оцінка й аналіз моделі.
Такий поділ досить умовний, оскільки окремі етапи тісно пов’язані між собою, а результат, отриманий на одному етапі, дає змогу скоригувати висновки попередніх етапів кореляційно-регресійного аналізу. Під попереднім аналізом розуміють весь процес дослідження явища, що розглядається, до збору вихідної інформації. На цьому етапі формуються основні напрями всього кореляційно-регресійного аналізу, формулюється завдання дослідження, обирається методика вимірювання результативного показника, тобто вимірник, який найкраще характеризує цей показник, визначається кількість факторів, що найсуттєвіше впливають на результативну ознаку. Факторні ознаки повинні відповідати таким вимогам:
- бути кількісними, найкраще – неперервними,
- розраховуватися з відношення до однієї бази,
- не дублювати одна одну, тобто не відображати ту саму сторону досліджуваного явища.
До інформаційної бази кореляційно-регресійного аналізу ставляться відповідні вимоги. Сукупність має бути досить великою за обсягом (за кількістю одиниць або спостережень), щоб визначені у процесі кореляційно-регресійного аналізу статистичні характеристики були достатньо типовими й надійними. Вихідні дані мають бути якісно та кількісно однорідними. Якісна однорідність передбачає наближеність умов формування результативних і факторних ознак, кількісна – відсутність одиниць спостереження, які за своїми числовими характеристиками суттєво відрізняються від основної маси даних.
Головний метод забезпечення однорідності – групування. Для збільшення кількості спостережень часто використовують метод об’єкто-періодів, суть якого полягає в тому, що дані з кожного об’єкта сукупності за кілька років розглядаються як самостійні спостереження.
Під час побудови кореляційно-регресійної моделі (рівняння регресії) передусім виникає питання про тип функції, яка найкраще відображає взаємозв’язок між результативною ознакою та ознаками-факторами, тобто вибір форми зв’язку. За формою розрізняють кореляційні зв’язки прямі й обернені, лінійні й криволінійні (нелінійні), одно- й багатофакторні. Прямі й обернені зв’язки розрізняють залежно від напряму зміни результативної ознаки. Якщо вона змінюється в тому самому напрямі, що й факторна (із збільшенням и результативна ознака збільшується, а із зменшенням – зменшується), то це – прямий зв’язок, якщо в іншому напрямі, – зв’язок обернений. Залежно від характеру зміни у із зміною х виділяють лінійні та нелінійні зв’язки. Якщо досліджується зв’язок між результативною ознакою та однією факторною – це одно факторна кореляційно-регресійна модель. Зв’язок між результативною ознакою і кількома факторами відображається багатофакторною моделлю (множинна кореляція).
Для встановлення ступеня кореляційної залежності між ознаками користуються різними показниками щільності зв’язку коефіцієнтом кореляції, коефіцієнтом детермінації, кореляційним відношенням (індекс кореляції), коефіцієнтом еластичності, а також сукупними індексами детермінації та кореляції. У випадку нелінійної залежності для вимірювання щільності зв’язку використовують кореляційне відношення (індекс кореляції). Коефіцієнт еластичності показує, на скільки відсотків змінюється У із зміною фактора X на 1%. Для аналізу щільності зв’язку в багатофакторній кореляційно-регресійній моделі складають матрицю парних коефіцієнтів кореляції, які вимірюють щільність лінійного зв’язку кожного фактора з результативною ознакою і з кожною з решти ознак-факторів (кореляційна матриця). Методика розрахунку таких коефіцієнтів та їх інтерпретація такі самі, як і для лінійного коефіцієнта кореляції у випадку однофакторної моделі. Для вимірювання щільності зв’язку між У і факторами, що входять до рівняння регресії, використовують сукупний індекс детермінації (індекс множинної детермінації).
Джерело:
Економічна енциклопедія: У трьох томах. Т. 2. / Редкол.: …С. В. Мочерний (відп. ред.) та ін. – К.: Видавничий центр “Академія”, 2000. – 864 с.