Применение нейронных сетей для прогноза динамики цен на недвижимость в Смоленской области

№104-1,

физико-математические науки

В статье рассмотрена возможность применения автоматизированных нейронных сетей пакета STATISTICA для анализа и прогнозирования временного ряда, составленного из квартальных данных. Проведено сравнение реальных цен на недвижимость и полученных с помощью построенной модели. Проведена проверка качества разработанной модели. На основе нейронной сети построен прогноз цен недвижимости на 2019-2020 год.

Похожие материалы

Ценовая ситуация, которая отражается в средних ценах на первичном и вторичном рынках, является основным фактором для оценки и прогнозирования в рамках исследования рынка недвижимости. Исходя из средних цен в регионах, цены устанавливаются на рынке недвижимости в целом на государственном уровне. Эти показатели учитываются при прогнозировании рыночной цены недвижимости, что важно при планировании социальной политики (расчет различных выплат, бюджетных средств на строительство жилых помещений и т. д.); осуществление сравнения регионов, что может помочь в устранении различий в развитии регионов; в разработке субъектами рынка недвижимости вспомогательных методик выбора стратегических действий для развития и совершенствования жилищной сферы; при расчете налоговых поступлений в бюджеты разных уровней и т. д.

Нелинейность нейронных сетей позволяет нам устанавливать нелинейные отношения между будущими и фактическими значениями процесса, что очень полезно при изучении временных рядов, характеризующих экономические явления и имеющих довольно сложную структуру. Так как моделирование временных рядов путем построения и объединения моделей тренда и сезонности не всегда приводит к желаемым результатам.

Для анализа динамики цен на недвижимость взяты квартальные данные Росстата за 2000-2018 года. По графику, отражающему исходный временной ряд, легко определить, что динамика цен на недвижимость, в целом обладает возрастающим трендом (см. рис. 1).

График квартальных цен на недвижимость по Смоленской области за 2010-2018 гг.
Рисунок 1. График квартальных цен на недвижимость по Смоленской области за 2010-2018 гг.

Чтобы проверить данный ряд на наличие сезонной периодичности, был проведен спектральный анализ Spectral (Fourier) analysis в пакете STATISTICA. Как видно на таблице 2, наибольшая периодичность наблюдается с шагом 76, что является полной выборкой, соответственно временной ряд не обладает сезонностью.

Таблица периодограммы
Рисунок 2. Таблица периодограммы

Далее была построена нейросетевая модель имеющихся данных при помощи модуля STATISTICA Automated Neural Networks (SANN) для последующего анализа и прогнозирования значений временного ряда.

Для того, чтобы провести оценку модели, сначала проведём ретроспективный прогноз и посчитаем среднюю абсолютную ошибку, для этого в первоначальную модель не будем брать последние 8 значений из выборки.

Процент наблюдений на обучающую выборку составил 85%, а на тестовую — 15%.

По умолчанию для нейронной сети был выбран тип многослойный персептрон (MLP). Максимальное значение скрытых нейронов установили равное 8, минимальное значение — 1, функцию активации для скрытых сетей была сохранена одна наилучшая, которая в дальнейшем была использована для прогноза. Параметры полученной нейронной сети представлены в Таблице 1.

Таблица 1. Характеристики нейронной сети

Net. name

Training perf.

Test perf.

Training algor.

Error func.

Hidden activat.

Output activat.

MLP8-1-1

0,974

0,982

BFGS 15

SOS

Identity

Identity

Информация из столбца Net. name указывает на название сети, которое соответствует ее архитектуре. Столбцы Training performance и Test performance отражают производительность обучения и контрольную производительность соответственно. Производительность характеризуется величиной корреляции между исходными данными, и данными, предсказанными сетью. Чем ближе значение к 1, тем лучше модель предсказывает данные. Полученная сеть имеет архитектуру MLP 8-3-1 — это многослойный персептрон, имеющий 8 нейронов на входном слое, 1 нейрон на выходном слое и 1 скрытый нейрон. Сеть имеет достаточно большую производительность 0,974. В Таблице 2 приведены исходные значения числа безработных граждан и значения, рассчитанные сетью, за 2017 и 2018 года.

Таблица 2. Сравнение исходных и предсказанных значений численности безработных (млн чел.)

Период

Исходное

Рассчитанное

Период

Исходное

Рассчитанное

II квартал 2017

39083,79

38407,69

I квартал 2018

39074,78

36915,93

II квартал 2017

39286,07

37995,02

II квартал 2018

39543,76

36866,25

III квартал 2017

39465,68

37472,31

III квартал 2018

38994,01

36859,35

IV квартал 2017

39605,73

37070,42

IV квартал 2018

39354,78

36793,15

Чтобы наглядно судить о качестве полученной модели MLP 8-3-1 был построен график рассеяния (см. рис. 3). Координатами для оси X служат исходные значения цен на недвижимость, а координатами оси Y — значения, рассчитанные сетью. Чем лучше точки ложатся на прямую, тем большей предсказательной способностью обладает сеть. Из графика видно, что практически все точки лежат очень близко к прямой, что свидетельствует о хорошей предсказательной способности модели.

График рассеяния
Рисунок 3. График рассеяния

Для визуальной оценки и подтверждения качества модели был построен график проекции сети с исходным рядом (см. рис. 4). Как видно из графика полученная модель хорошо ложится на исходный ряд.

График исходных и предсказанных значений
Рисунок 4. График исходных и предсказанных значений

Так как построенная модель является достаточно адекватной, на ее основе были получены квартальные прогнозы цен на недвижимость Смоленской области на 2019-2020 года (см. рис. 5).

График предсказанных значений на 2019-2020 года
Рисунок 5. График предсказанных значений на 2019-2020 года

Числовые значения предсказанной численности безработных в 2019 году представлены в Таблице 3.

Таблица 3. Прогноз цен недвижимости на 2019-2020 года

Период

Цена (руб. на 1 кв.м)

Период

Цена (руб. на 1 кв.м)

III квартал 2019

39458,60

III квартал 2020

40109,96

III квартал 2019

39579,70

III квартал 2020

40222,62

III квартал 2019

39851,60

III квартал 2020

40398,95

III квартал 2019

39975,53

III квартал 2020

40594,45

Таким образом, предсказанные значения цен на недвижимость в Смоленской области в 2019 и 2020 годах сохраняют тенденцию к постепенному повышению, которая наблюдалась в России на протяжении нескольких последних лет. Прогнозирование рыночной цены недвижимости важно при планировании социальной политики (расчет различных выплат, средств бюджета на строительство жилых помещений и т.д.); осуществлении сравнения регионов, что может помочь в устранении различий в развитии регионов; в разработке субъектами рынка недвижимости вспомогательных техник выбора стратегических действий для развития и совершенствования жилищной сферы; при расчете налоговых поступлений в бюджеты разных уровней и т.д.

Список литературы

  1. Бокс Дж., Дженкинс Г. "Анализ временных рядов. Прогноз и управление" — М.: Мир, 1994 г.
  2. Владимирова Л.П. Прогнозирование и планирование в условиях рынка: учеб. пособие. М.: Изд. дом "Дашков и К", 2000. 308 с.
  3. Дуброва Т.А. Статистические методы прогнозирования. — М.: ЮНИТИ-ДАНА, 2003.
  4. Халафян А.А. STATISTICA 6. Статистический анализ данных. ООО "Бином-Пресс", 2009. — 512 с.