Big Bang Data — спецпроект о больших данных, которые называют «новой нефтью» и считают главным открытием цифрового века. Уже понятно, что они изменят нашу жизнь, вопрос только в том, во что превратится привычная повседневность — в рай на Земле или в антиутопию. Какой из сценариев более вероятен, разбираемся с помощью кейсов по большим данным, экспертов компании МегаФон
и студентов института «Стрелка».

Очередной материал — это интерактивная экспозиция курсового проекта Александра Аюпова, эрудита и студента «Стрелки», который с помощью больших данных открыл новый показатель городского развития. 

 

   

 

Автомобиль всегда движется из точки
А в точку B.

 

   

 


Расстояние между ними и траектория движения могут быть любыми, но в 99% случаев водитель стремится попасть в точку назначения как можно быстрее.

При этом всё то, что находится между точками A и B, может как помочь ему 
в этом, ускоряя движение (автобан, хорошее дорожное покрытие, пустыня по сторонам), так и, напротив, заставить его замедлить ход или вовсе остановиться. Остановки могут происходить по разным причинам — некоторые из них объясняются желаниями водителя, другие же диктуют обстоятельства, дорожная инфраструктура или ПДД.

 

Как бы то ни было, остановка
— это не просто потеря скорости.

   


В большинстве случаев водители останавливаются там, где для этого созданы условия — построены технические и заправочные станции, прочерчена разметка, установлены светофоры, открыты магазины, рестораны, развлекательные центры.

Развивая эту гипотезу, Александр предположил, что по частоте остановок можно оценить уровень урбанизации территории. В современной науке о том же самом принято судить по плотности населения, которая на самом деле не отражает динамических связей между людьми и городской средой.

Для доказательства своей теории Александр использовал большие данные. Прежде всего он сохранил и перенёс открытую базу трекингов с GPS-навигаторов на карту Open Street Map — таким образом из общего массива информации
он выделил данные о движении только московских и подмосковных водителей. Затем при помощи языков программирования Java и R, а также системы QGIS
он привязал каждую остановку каждого водителя к географическим и временным координатам.

 

Алгоритм обработал 160 миллионов GPS-треков или 15 гигабайт данных.. Изображение № 1.Алгоритм обработал 160 миллионов GPS-треков или 15 гигабайт данных.

 

 
В итоге Александр получил карту остановок в Москве и Московской области,
на которой контуры столицы, городов-спутников, городков, посёлков и дорог почти полностью повторяют привычные.

 

   

Плотность остановок выявила плотность городской застройки.

   


Остановки за минуту — новый показатель уровня урбанизации, введённый Александром. Применяя его к любому населённому пункту, можно найти его место на шкале урбанизации от деревни до мегалополиса.

 

 

Сутки в Москве
Утро (05—12 часов)
День (12—18 часов)
Вечер (18—01 часов)
Ночь (01—05 часов)

 

 

   

В первую очередь Александр
проверил Москву

   

Оказалось, что в дневные и вечерние часы она действительно оправдывает статус мегаполиса, а ночью и ранним утром превращается в мегадеревню — контуры её улиц едва прослеживаются на карте остановок.

 

 
Москвы Александру оказалось мало, так что вместе 
с другими студентами курса он предпринял поездку 
в Казань и обратно, фиксируя по пути все остановки автомобиля. Этот любопытный эксперимент обнаружил 
на карте присутствие неизвестного крупного города между Владимиром и Нижним Новгородом и разжаловал Чебоксары до статуса посёлка городского типа.


В дальнейших планах Александра — добавить к своему показателю развития города пространственный аспект — остановки за минуту за метр.

 Big Bang Data: Как студент «Стрелки» открыл на карте новые города. Изображение № 3.

 

   

Автомобиль всегда движется из точки
A в точку Z через множество остановок
B, C, D, E и т.д.

 

 

 

Big Bang Data: Как студент «Стрелки» открыл на карте новые города. Изображение № 4.




Полевое исследование Александра.
В первом случае он ехал на автомобиле 
с проспекта Вернадского на Стрелку и обратно, во втором — передвигался
хаотично.

Среднее количество остановок в минуту:
в первом случае — 1,16,
во втором — 0,77.

 

 

 

Big Bang Data: Как студент «Стрелки» открыл на карте новые города. Изображение № 5.

РОМАН ПОСТНИКОВ
директор по сегментному маркетингу и клиентской аналитике ОАО «МегаФон»

 

Сама проблематика исследования выглядит интересно, но его явно можно и нужно продолжать — в частности, расширять анализ за счёт других характеристик остановок. Предложенный показатель «остановки за минуту за метр», скорее, свидетельствует о распространённости бессветофорных развязок в городской черте и о структуре городского планирования — радиально-кольцевая она или, как в Нью-Йорке, прямоугольная. При этом в последнем случае пропускная способность дорог в квартале, скорее всего, будет даже выше при большем количестве остановок на километр пути — потому что пробку можно объехать по параллельным улицам.

Если же проанализировать другой параметр остановки — длительность, и попытаться выкристаллизовать её причины, то высока вероятность получить достаточно интересный фактор сравнения. Применив его к Москве, можно выделить в ней «районы-магниты» и «районы-дороги». «Магниты» притягивают жителей культурными и общественными объектами, остановки в них более длительные, и именно эти районы действительно характеризуют город как насыщенный инфраструктурой и притягательный для жителей. «Районы-дороги» же, увы, заставляют созерцать их каждый день по дороге на работу и домой, стоя в пробке или на очередном светофоре.

 

 

Big Bang Data: Как студент «Стрелки» открыл на карте новые города. Изображение № 6.