Корреляционный анализ
Цели и задачи
Цель работы – рассмотреть сущность и основы корреляционно-регрессионного анализа.
Введение и актуальность
Методы оценки близости отношений делятся на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и используются в тех случаях, когда исследуемая популяция состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы - параметрические - и корреляцию принято называть.
Непараметрические методы не накладывают ограничений на закон распределения исследуемых величин. Их преимуществом является простота расчетов.
Чтобы установить наличие корреляционных зависимостей, используется ряд конкретных методов: параллельное сравнение зависимого и факторного признака, графическое представление фактических данных с использованием поля корреляции, построение таблицы корреляции.
Сравнение двух параллельных рядов является самым простым методом обнаружения связи. Значения факторного признака располагаются в порядке возрастания в первом ряду; во второй строке записать соответствующие значения результирующего атрибута (то есть значения, относящиеся к одной и той же единице); затем отслеживается направление изменения результирующей черты.
Недостатком метода сопоставления выступает неудобство восприятия рядов при наличии значительного количества разных значений результативного показателя Y, которые соответствуют одному и тому же значению факторного признака X. В данном случае разумно использовать корреляционными и групповыми таблицами.
Макет корреляционной таблицы отражен в таблице 1. При построении корреляционной таблицы при большом количестве вариантов факторного и результативного признаков рекомендует применять группировку их значений по интервалам, при этом деление на интервалы происходит по формуле Стэрджесса. Тогда наименованиями строк и столбцов будут выступают интервалы факторного и результативного показателя соответственно.
Заключение и вывод
Изучая природу, общество, экономику, нужно принимать во внимание взаимосвязь наблюдаемых процессов и явлений. При анализе конкретных зависимостей одни признаки являются факторами, которые обусловливают изменение других признаков. Признаки первой группы имеют название факторных, а признаки второй группы - результативных.
Показатели тесноты связи предоставляют возможность дать характеристику зависимости вариации результативного показателя от вариации факторного признака. Имеется большое число методов оценки тесноты связи.
Задачи регрессионного анализа состоит в нахождении формы зависимости, установления вида функции регрессии, применение уравнения для анализа неизвестных значений результативной переменной.
Примерное представление о тесноте связи можно получить с использованием эмпирической линии регрессии. Данная линия строится по групповым средним. Она зачастую является ломаной линией. Эмпирическая линия связи является основой для выбора и обоснования типа теоретической линии регрессии.
В ходе выполнения практической части был расчитан линейный коэффициент корреляции; значимость коэффициент корреляции; при определении t кр критического значения статистики Стьюдента воспользоваться функцией СТЬЮДРАСПОБР; доверительный интервал полученного коэффициента корреляции; при определении параметра Z’ воспользоваться функцией ФИШЕР, а для нахождения коэффициента корреляции на границах доверительного интервала воспользоваться функцией ФИШЕРОБР.
Коэффициент корреляции показывает, что связь между признаками очень слабая и прямая.
Коэффициент детерминации характеризует долю вариации результативного признака под влиянием фактора, он составил 0,0761.
7,61% вариации потребительских расходов домашних хозяйств у происходит под влиянием величины располагаемых ресурсов х. Остальные 92,39% вариации результативного признака у объясняется влиянием прочих случайных факторов.
Поскольку , то нулевую гипотезу принимаем с вероятностью допустить ошибку в 5%, коэффициент корреляции не является статистически значимым, корреляционная связь между располагаемыми ресурсами и потребительскими расходами случайна.
Доверительный интервал составил -0,2825 0,8490.В интервал попадает 0, коэффициент корреляции не значим.
Показатели тесноты связи предоставляют возможность дать характеристику зависимости вариации результативного показателя от вариации факторного признака. Имеется большое число методов оценки тесноты связи.
Задачи регрессионного анализа состоит в нахождении формы зависимости, установления вида функции регрессии, применение уравнения для анализа неизвестных значений результативной переменной.
Примерное представление о тесноте связи можно получить с использованием эмпирической линии регрессии. Данная линия строится по групповым средним. Она зачастую является ломаной линией. Эмпирическая линия связи является основой для выбора и обоснования типа теоретической линии регрессии.
В ходе выполнения практической части был расчитан линейный коэффициент корреляции; значимость коэффициент корреляции; при определении t кр критического значения статистики Стьюдента воспользоваться функцией СТЬЮДРАСПОБР; доверительный интервал полученного коэффициента корреляции; при определении параметра Z’ воспользоваться функцией ФИШЕР, а для нахождения коэффициента корреляции на границах доверительного интервала воспользоваться функцией ФИШЕРОБР.
Коэффициент корреляции показывает, что связь между признаками очень слабая и прямая.
Коэффициент детерминации характеризует долю вариации результативного признака под влиянием фактора, он составил 0,0761.
7,61% вариации потребительских расходов домашних хозяйств у происходит под влиянием величины располагаемых ресурсов х. Остальные 92,39% вариации результативного признака у объясняется влиянием прочих случайных факторов.
Поскольку , то нулевую гипотезу принимаем с вероятностью допустить ошибку в 5%, коэффициент корреляции не является статистически значимым, корреляционная связь между располагаемыми ресурсами и потребительскими расходами случайна.
Доверительный интервал составил -0,2825 0,8490.В интервал попадает 0, коэффициент корреляции не значим.
Нужна похожая работа?
Оставь заявку на бесплатный расчёт