Реализация регрессионного анализа в различных компьютерных программах

№77-1,

Физико-математические науки

Регрессионный анализ нашел широкое применение для выявления вида зависимостей в различных процессах и яалениях. В работе рассмотрены компьютерные программы, которые позволяют провести регрессионный анализ: Microsoft Office Excel, Stadia, Statistica. Рассмотрены способы проведения регрессионного анализа в данных программах.

Похожие материалы

Статистический анализ данных нашёл широкое применение при анализе практически всех процессов и явлений. Если речь идёт о выявлении статистической зависимости, то в большинстве случаев используется регрессионный анализ. Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную. Результатом применение регрессионного анализа является построение уравнения регрессии, которое в общем виде имеет вид:
Y=f(X_1, X_2,..., X_n) (1).

В случае линейной зависимости уравнение (1) принимает вид:

Y=a_0+a_1\cdot X_1+ a_2\cdot X_2+...+ a_n\cdot X_n) (2)

В формулах (1) и (2) Y — зависимая переменная, Xn — независимые переменный.

При проведении регрессионного анализа возникает вопрос о средстве, с помощью которого данный анализ будет проведён. В работе рассмотрена реализация регрессионного анализа в следующих компьютерных программах: Microsoft Office Excel, Stadia, Statistica. Процедура регрессионного анализа состоит из нескольких этапов [2], а именно:

  1. задание математической формы уравнения регрессии и определение параметров регрессии (коэффициентов регрессионного уравнения).
  2. определение взаимосвязи результативного признака и факторов, проверка статистической значимости уравнения регрессии.
  3. проверка статической значимости каждого коэффициента уравнения регрессии и определение их доверительных интервалов.

Наибольшую популярность для построения графиков зависимости и получения математической формы уравнения регрессии приобрёл табличный редактор Microsoft Office Excel. Это вызвано тем, что данная программа является русифицированной и с ней начинают знакомство ещё в школе. Графическое представление уравнение регрессии в MS Excel возможно только для одномерного случая. При этом регрессионная функция может быть следующей:

  1. линейная;
  2. экспоненциальная;
  3. логарифмическая;
  4. степенная;
  5. полиномиальная (до 6 степени).

Процесс получения графика зависимости в MS Excel является достаточно простым. При имеющимся наборе данных независимой (Y) и зависимой переменной (X), строится точечная диаграмма, на которую добавляется линия тренда. Линия тренда — это и есть график регрессионной зависимости. При необходимости на график можно добавить уравнение регрессии и коэффициент детерминации. На рисунке 1 «Регрессионный анализ в MS Excel» показаны примеры графиков зависимости, соответствующие данным графикам уравнения регрессии и коэффициенты детерминации.

Регрессионный анализ в MS Excel
Рисунок 1. Регрессионный анализ в MS Excel

MS Excel позволяет провести более глубокий регрессионный анализ путём использования пакета анализа данных. Для работы с регрессией необходимо открыть вкладку «Анализ данных — Регрессия» и выбрать входные параметры для анализа. В результате программа выдаст результаты регрессионного анализа, пример которых приведён на рисунке 2 «Результаты регрессионного анализа в MS Excel».

Результаты регрессионного анализа в MS Excel
Рисунок 2. Результаты регрессионного анализа в MS Excel

При проведении регрессионного анализа через пакет анализа данных программа выводит коэффициенты уравнения линейной регрессии, статистические показатели значимости коэффициентов регрессии и уравнения в целом, а так же доверительные интервалы. Следует отметить, что полученная регрессионная модель является линейной и одномерной.

Программа для статистической обработки результатов Stadia является редкой. Во многом это связано с её примитивным дизайном, который на протяжении [1] многих лет не изменялся. Несмотря на простой вид, программа имеет ряд преимуществ, среди которых можно выделить русский язык интерфейса и полученных результатов.

Регрессионный анализ в Stadia реализован как для случая одномерных моделей, так и для множественных линейных и нелинейных моделей. На рисунке 3 «Результаты множественного регрессионного анализа» приведены результаты множественного регрессионного анализа бля случая линейной модели с двумя независимыми факторами.

Результаты множественного регрессионного анализа
Рисунок 3. Результаты множественного регрессионного анализа

Программа Stadia выдаёт все результаты на русском языке. Первый блок результатов относится к коэффициентам уравнения регрессии, где приводятся сами коэффициенты и их значимость. Второй блок результатов относится к дисперсии. Третий блок позволяет судить о статистической значимости модели по приведенным там значениям F-критерия и множественного коэффициента детерминации. Следует отметить, что после всех результатов программа выдаёт ту статистическую гипотезу, которую следует принять.

Программа Stadia позволяет получать результаты не только в случае линейной, но и нелинейной однофакторной и многофакторной регрессии. Вид нелинейной множественной регрессии пользователь может задать самостоятельно в специальном окне во вкладке «Общая/нелинейная модель». На рисунке 4 «Нелинейная пользовательская модель в Stadia» показан пример нелинейной множественной регрессии и полученные для данной модели результаты. Модель задавалась пользователем самостоятельно.

Нелинейная пользовательская модель в Stadia
Рисунок 4. Нелинейная пользовательская модель в Stadia

Построение графиков регрессионной модели в программе Stadia реализовано плохо. Следует отметить, что работа велась с учебной версией программы Stadia 8.0.

Одной из самых распространённых программ для статистической обработки данных является программа Statistica. Интерфейс программы Statistica написан на английском языке, однако встречаются и русскоязычные ознакомительные версии программы. Данная программа имеет большой функционал для проведения регрессионного анализа. Итоги регрессионного анализа приведены подробно. В итоговых таблицах находится вся необходимая информация о результатах регрессионного анализа. При необходимости, можно провести анализ остатков регрессии. На рисунке 5 «Регрессия в Statistica» показан пример результатов регрессионного анализа, проведенного в программе Statistica.

Регрессия в Statistica
Рисунок 5. Регрессия в Statistica

Следует отметить, что статистически значимые результаты на заданном уровне значимости автоматически выделяются красным цветом, что является информативным. Также программа Statistica позволяет строить графики по полученным регрессионным моделям, в том числе и множественным. На рисунке 6 «График множественной регрессии» изображен график регрессии, результаты которой приведены на рисунке 5.

График множественной регрессии
Рисунок 6. График множественной регрессии

Программа Statistica имеет большой функционал по работе с нелинейными регрессионными моделями. Составление пользовательских нелинейных регрессионных моделей производится путём выбора вкладки «Анализ — Углублённые методы анализа — Множественная нелинейная регрессия».

Таким образом, если требуется провести линейный однофакторный регрессионный анализ без выяснения статистической значимости полученной модели, то целесообразно использовать табличный редактор Microsoft Office Excel. Также Microsoft Office Excel можно использовать для построения линейной однофакторной регрессионной модели. Для проведения подробного регрессионного анализ, либо для получения нелинейных однофакторных и многофакторных регрессионных моделей лучше использовать программу Statistica. Богатый функционал, доступность и наглядность результатов анализа, графические возможности и большое количество методической литературы делаю данную программу незаменимым средством для проведения регрессионного анализа. Программа Stadia является довольно редкой программой и её интерфейс не соответствует требованию настоящего времени.

Список литературы

  1. Современное программное обеспечение для статистической обработки биомедицинских исследований / В.А. Герасевич, А.Р. Аветисов, 2005 Белорусский медицинский журнал, № 1, с. 14.
  2. Студопедия. Суть и этапы регрессионного анализа. URL: https://studopedia.su/14_173066_sut-i-etapi-regressionnogo-analiza.html Дата обращения: 08.01.2018