python

Анализ рынка недвижимости на основе данных с msgr.ru

  • воскресенье, 9 февраля 2020 г. в 00:24:09
https://habr.com/ru/post/487370/
  • Python
  • Data Mining
  • Big Data
  • Визуализация данных
  • Исследования и прогнозы в IT


Недавно столкнулся с проблемой выбора квартиры и конечно первым делом решил узнать, что происходит на рынке недвижимости и, как это обычно бывает, половина экспертов с youtube.com говорят, что недвижимость будет расти, другая утверждает, что наоборот цена будет падать. В итоге решил разобраться сам, и вот, что из этого вышло.



© Designed by upklyak / Freepik


Чтобы понять как изменялась цена в последнее время нужно было найти реальные цены продажи недвижимости. Цены с целевых сайтов типа cian.ru или avito.ru не подходят, так как там обычно квартиры уходят со скидкой и реальную цену продажи узнать нельзя, тут я и заметил сайт по продаже недвижимости на котором можно было посмотреть действительную цену за которую купили квартиру, речь конечно идет о сайте msgr.ru, более подробно о нём можно прочитать в этом обзоре, в двух словах можно сказать, что эта организация занимается реализацией квартир по договору исполненной ренты на торгах.


Чтобы узнать в каких райноах Москвы какие цены, а также любопытно было бы посмотреть на какие квартиры торгуются больше, в каких районах покупают ближе к стартовой цене, а в каких цена может сильно измениться. Для этого я в первую очередь спарсил данные с сайта msgr.ru, данные эти делятся на два вида: прошедшие и не прошедшие аукционы, причём квартиры, которые не были проданы могут быть в двух местах сразу.


Спарсенные данные я свёл в таблицу для наглядности:

В таблице приведены данные за последние 10 аукционов.


В приведенной выше таблице в колонке 'A' указана информация об аукционных квартирах (адресса без пробелов и заглавных букв из-за разниц написания в исходных данных), в первой строке указаны даты будущих и прошедщих аукционов. Проданные квартиры заполняюся 'xxx' по строке (это сделано для того, чтобы понять какие квартиры могут быть доступны в ещё не анонсированных аукционах), в верхней строке ячейки указана стартовая цена, а в нижней цена продажи, в ячейках будущих аукционов ссылка с описанием квартиры.


Также в этой таблице можно увидеть некоторые любопытные закономерности, например как правило если квартира не продается за два аукциона, то на третьем аукционе цена будет снижена и так каждые два аукциона, хотя если посмотреть на большей выборке, то из этого правила есть исключения и квартира дешевеет уже на следующий аукцион, если не была продана на первом.


Чтобы понять в каких районах и на какие группы квартир больше торгуются я разместил все адреса на карте:

Ссылка на полную карту.


На карте отмечены адреса квартир которые были или будут проданы, в заголовке метки указана цена продажи (не продажи / аукциона), год продажи и число, с какого раза была продана квартира. Цифра в метке показывает количество комнат в квартире. В описании метки находится информация об прошедших и будущих аукционах, а также адрес (адресса без пробелов и заглавных букв из-за разниц написания в исходных данных) и прочая информация о квартире.


Благодаря карте можно посмотреть как изменялась цена в райное со временем, на сколько сильно торгуются на похожие варианты. Из интересного можно отметить, что новый фонд, т.е. квартиры в новых домах даже в районах с плохой транспортной доступностью как правило продаются с торгом, а вот квартиры старого фонда вполне можно купить по стартовой цене или с небольшим торгом. По карте можно сделать примерный прогноз по торгам, рассматривая уже проданные ранее квартиры расположенные вокруг квартиры выставленной на аукцион.


Хотя и не совсем правильно сравнивать квартиры старого и нового фонда, да и аукционные квартиры сильно смещены в сторону старго фонда в силу специфики msgr.ru, но всё же рассмотрим некоторые гистограммы с этими допущениями.


Гистограмма средних цен на квартиры по годам и количеству комнат:

Общее количество квартир: 397


Средние цены не совсем корректно рассматривать в отрыве от района нахождения, по-этому рассмотрим квартиры в каждом районе отдельно (рассмотренны только райноы внутри МКАД).


Гистограмма средних цен на однокомнатные квартиры, разделенные по районам и году:

Общее количество однокомнатных квартир: 218


Гистограмма средних цен на двухкомнатные квартиры, разделенные по районам и году:

Общее количество двухкомнатных квартир: 159


К сожалению трёхкомнатных квартир слишком мало, в силу этого никакой сколько-нибудь корректной гистограммы построить нельзя.

Общее количество трёхкомнатных квартир: 20


Учитывая допущения изложенные выше (опять же, на момент написания статьи в 2020 году прошел только один аукцион), всё же можно сделать некоторые выводы, если посмотреть на распределение цен по районам, то можно заметить, что в целом цена растёт, однако уже сейчас намечается разворот, так цены в некоторых районах начинают разворачиваться, а в других начинает замедляться рост (что в общем-то свидетельствует о достижении максимальных цен и скорее всего последующем их снижении).


Исходный код на github.com