Корреляционно-регрессионный анализ

Цели и задачи

Целью настоящего курсового проекта является: овладеть основами теории и практики корреляционно-регрессионного анализа.

Введение и актуальность


В естественных науках часто речь идет о функциональной зависимости (связи), когда каждому значению одной переменной соответствует вполне определенное значение другой. Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными (например, зависимость скорости падения в вакууме от времени и т.п.), так и между случайными величинами (например, зависимость стоимости проданных изделий от их числа и т.п.).
В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость (связь) получила название статистической (или стохастической, вероятностной).
Возникновение понятия статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками. Примером статистической связи является зависимость урожайности от количества внесенных удобрений, производительности труда на предприятии от его энерговооруженности и т.п.
В силу неоднозначности статистической зависимости между Y и Х для исследователя, в частности, представляет интерес усредненная по x схема зависимости, т.е. закономерность в изменении среднего значения - условного математического ожидания (Y) (математического ожидания случайной переменной Y, найденного при условии, что переменная Х приняла значение х ) в зависимости от х.
Таким образом статистическая зависимость между двумя переменными, при которой каждому значению одной переменной соответствует определенное среднее значение, т.е. условное математическое ожидание другой, называется корреляционной.
Иначе, корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой:
yx=fx,
Данное уравнение называют выборочным уравнением регрессии Y на X, f(x) – выборочная функция регрессии Y на X. Аналогично уравнение вида xy=φy –выборочное уравнение регрессии X на Y.
Теория корреляции решает следующие задачи:
1) Установление формы корреляционной зависимости, т.е. вида функций fx, φy (если обе функции fx, φy являются линейными, то корреляционная зависимость называется линейной; в противном случае – нелинейной корреляционной зависимостью);
2) Оценка силы (тесноты) корреляционной зависимости.
Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями.
Уравнение прямой среднеквадратической регрессии  Y на X имеет вид
,
где , - средние значения величин х и у,  σx=√D(X),  σy=√D(Y),  r —коэффициент корреляции величин X и Y.
Аналогично существует уравнение прямой среднеквадратической регрессии X на Y:

Заключение и вывод


В результате выполнения работы мною были рассмотрены теоретические основы корреляционного и регрессионного анализа: линейная регрессия и линейная корреляция. На основе рассмотренных теоретических положений можно сказать, что корреляционно-регрессионный анализ широко применяется в различных сферах аналитической деятельности.
Для того чтобы построить точное уравнение зависимости двух величин чаще всего используется метод наименьших квадратов.
Если визуальный анализ диаграммы рассеяния позволяет определить линейную зависимость между величинами, то используется коэффициент корреляции по Пирсону, который позволяет оценить тесноту связи переменных величин, если же просматривается нелинейная зависимость, то используется корреляционное отношение.
Во второй главе представлен пример использования теоретических знаний для анализа выборки из 50 пар наблюдений (х, у).
На основе исходных данных было построено корреляционное поле, определены параметры выборочного уравнения прямой линии среднеквадратичной регрессии Y на X и X на Y, построены обе линии регрессии, наложенные на корреляционное поле, и визуально оценена адекватность линейной модели. Также была оценена теснота корреляционной связи с помощью выборочного коэффициента корреляции. Используя встроенные средства MS Excel был произведен регрессионный анализ, что подтвердило правильность произведенных расчетов.

Нужна похожая работа?

Оставь заявку на бесплатный расчёт

Смотреть все Еще 421 дипломных работ