Корреляционный анализ

Цели и задачи

Цель работы – рассмотреть сущность и основы корреляционно-регрессионного анализа.

Введение и актуальность


Методы оценки близости отношений делятся на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и используются в тех случаях, когда исследуемая популяция состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы - параметрические - и корреляцию принято называть.
Непараметрические методы не накладывают ограничений на закон распределения исследуемых величин. Их преимуществом является простота расчетов.
Чтобы установить наличие корреляционных зависимостей, используется ряд конкретных методов: параллельное сравнение зависимого и факторного признака, графическое представление фактических данных с использованием поля корреляции, построение таблицы корреляции.
Сравнение двух параллельных рядов является самым простым методом обнаружения связи. Значения факторного признака располагаются в порядке возрастания в первом ряду; во второй строке записать соответствующие значения результирующего атрибута (то есть значения, относящиеся к одной и той же единице); затем отслеживается направление изменения результирующей черты.
Недостатком метода сопоставления выступает неудобство восприятия рядов при наличии значительного количества разных значений результативного показателя Y, которые соответствуют одному и тому же значению факторного признака X. В данном случае разумно использовать корреляционными и групповыми таблицами.
Макет корреляционной таблицы отражен в таблице 1. При построении корреляционной таблицы при большом количестве вариантов факторного и результативного признаков рекомендует применять группировку их значений по интервалам, при этом деление на интервалы происходит по формуле Стэрджесса. Тогда наименованиями строк и столбцов будут выступают интервалы факторного и результативного показателя соответственно.

Заключение и вывод

Изучая природу, общество, экономику, нужно принимать во внимание взаимосвязь наблюдаемых процессов и явлений. При анализе конкретных зависимостей одни признаки являются факторами, которые обусловливают изменение других признаков. Признаки первой группы имеют название факторных, а признаки второй группы - результативных.
Показатели тесноты связи предоставляют возможность дать характеристику зависимости вариации результативного показателя от вариации факторного признака. Имеется большое число методов оценки тесноты связи.
Задачи регрессионного анализа состоит в нахождении формы зависимости, установления вида функции регрессии, применение уравнения для анализа неизвестных значений результативной переменной.
Примерное представление о тесноте связи можно получить с использованием эмпирической линии регрессии. Данная линия строится по групповым средним. Она зачастую является ломаной линией. Эмпирическая линия связи является основой для выбора и обоснования типа теоретической линии регрессии.
В ходе выполнения практической части был расчитан линейный коэффициент корреляции; значимость коэффициент корреляции; при определении t кр критического значения статистики Стьюдента воспользоваться функцией СТЬЮДРАСПОБР; доверительный интервал полученного коэффициента корреляции; при определении параметра Z’ воспользоваться функцией ФИШЕР, а для нахождения коэффициента корреляции на границах доверительного интервала воспользоваться функцией ФИШЕРОБР.
Коэффициент корреляции показывает, что связь между признаками очень слабая и прямая.
Коэффициент детерминации характеризует долю вариации результативного признака под влиянием фактора, он составил 0,0761.
7,61% вариации потребительских расходов домашних хозяйств у происходит под влиянием величины располагаемых ресурсов х. Остальные 92,39% вариации результативного признака у объясняется влиянием прочих случайных факторов.
Поскольку , то нулевую гипотезу принимаем с вероятностью допустить ошибку в 5%, коэффициент корреляции не является статистически значимым, корреляционная связь между располагаемыми ресурсами и потребительскими расходами случайна.
Доверительный интервал составил -0,2825 0,8490.В интервал попадает 0, коэффициент корреляции не значим.

Нужна похожая работа?

Оставь заявку на бесплатный расчёт

Смотреть все Еще 421 дипломных работ