Original size 1140x1600

Транспорт в цифрах: анализ данных автобусов в Нью-йорке

PROTECT STATUS: not protected

Рубрикатор

  1. Концепция
  2. Введение
  3. Цветовая палитра
  4. Анализ скоростей автобусов
  5. Анализ средней скорости автобуса по часам суток
  6. Анализ распределения автобусов по топ-10 маршрутам
  7. Анализ скорости и пути
  8. Анализ соотношения скорости и типа дня
  9. Вывод
  10. Описание применения генеративной модели
  11. Ссылки

Концепция

В рамках проекта проводится анализ данных, характеризующих работу автобусного транспорта в городе Нью-Йорк. В качестве эмпирической базы используются данные о маршрутах, расписаниях, фактическом времени движения, задержках и пассажиропотоке.

Датасет был получен из открытых источников (NYC Open Data / Kaggle) и представляет собой структурированный массив информации о работе автобусной сети мегаполиса, включающий пространственные, временные и операционные параметры.

Выбор данной темы обусловлен значимостью общественного транспорта в формировании городской мобильности и качества жизни населения. Автобусная система Нью-Йорка является одной из крупнейших в мире, что делает её репрезентативным примером для анализа транспортных процессов в условиях высокой плотности застройки и интенсивных пассажирских потоков.

Анализ данных позволяет выявить закономерности в работе автобусных маршрутов, определить наиболее проблемные зоны и временные интервалы, а также оценить эффективность функционирования транспортной системы с точки зрения регулярности и доступности перевозок.

Введение

Для визуализации и анализа данных в рамках проекта были использованы следующие типы графиков:

  1. Столбчатая диаграмма — была использована для визуализации анализа скоростей автобусов и их скоростей
  2. Линейный график
  3. Круговая диаграмма
  4. Точечная диаграмма
  5. Тепловая карта нормализованных показателей

Цветовая палитра

Original size 2715x1247

Анализ скоростей автобусов

Я использовала код, чтобы проанализировать среднюю скорость автобусов на маршруте и их количество.

Анализ средней скорости

Так же с помощью кода был построен линейный график для выявления средней скорости автобуса по часам суток.

Анализ распределения маршрутов

В данном анализе мне стало интересно, насколько много в процентом соотношении распределяется автобусов по маршрутам

Анализ скорости против времени пути

В этом анализе я решила проверить, как количество времени в пути меняется от средней скорости потока

Анализ типов автобусов

Я написала код для того чтобы выяснить, как тепловая карта позволяет выявить временные паттерны изменения скорости в зависимости от типа дня и времени суток.

Вывод

В рамках данного проекта был проведён анализ данных о скорости движения автобусного транспорта в центральных районах Нью-Йорка на основе открытого датасета MTA. Исходные данные были предварительно очищены и подготовлены к анализу: выполнено приведение типов, обработка текстовых значений числовых показателей и структурирование временных признаков.

С помощью библиотеки Pandas были исследованы распределения средней скорости движения, её изменения в зависимости от времени суток, типа маршрута и продолжительности поездки. Для визуального анализа были использованы различные типы графиков — гистограммы, линейные графики, boxplot-диаграммы, тепловые карты и точечные диаграммы, что позволило рассмотреть данные с разных сторон и выявить устойчивые закономерности.

Результаты анализа показали, что скорость движения автобусного транспорта существенно варьируется в зависимости от времени суток и характеристик маршрута. В частности, наблюдается снижение средней скорости в периоды повышенной транспортной нагрузки, а также обратная зависимость между временем в пути и средней скоростью движения. Это указывает на влияние городского трафика и инфраструктурных ограничений центральных районов на эффективность общественного транспорта.

Визуализация данных была выполнена в едином минималистичном стиле с тёмной цветовой палитрой, что позволило повысить читаемость графиков и акцентировать внимание на ключевых аналитических выводах. Используемый объясняющий формат визуализации делает результаты анализа понятными даже для аудитории без технической подготовки.

В целом, проект демонстрирует, как методы анализа данных и визуализации могут использоваться не только для описания текущего состояния городской транспортной системы, но и для выявления потенциальных направлений её оптимизации, таких как корректировка маршрутов, изменение приоритетов движения и более точное планирование транспортных потоков.

Описание применения генеративной модели

В процессе выполнения проекта использовалась генеративная модель искусственного интеллекта ChatGPT (модель GPT-5.2). Генеративная модель применялась в качестве вспомогательного инструмента для поддержки аналитической работы и обучения.

С её помощью были получены рекомендации по структуре анализа данных, формированию логики визуализаций, а также примеры кода на языке Python с использованием библиотеки Pandas и средств визуализации. Кроме того, генеративная модель использовалась для помощи в формулировании аналитических выводов и текстовых описаний результатов исследования.

При этом все ключевые решения — выбор датасета, этапы очистки данных, интерпретация полученных результатов и финальные выводы — принимались автором проекта самостоятельно. Генеративная модель не использовалась для автоматической обработки данных или генерации итоговых графиков без участия автора, а выступала исключительно как инструмент консультационной и методической поддержки.

Использование генеративной модели позволило ускорить процесс работы, повысить качество структуры проекта и сосредоточиться на аналитической интерпретации данных и визуальном оформлении результатов.

Ссылки

Ссылка на используемую модель: https://openai.com/chatgpt

Транспорт в цифрах: анализ данных автобусов в Нью-йорке
Project created at 05.02.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more