
В рамках этого проекта я провела анализ рынка подержанных автомобилей компании BMW. Мой интерес к данному датасету был вызван желанием разобраться, какие факторы влияют на ценообразование Б/У автомобилей. Также мне было важно выделить, какие модели можно отнести к доступным, а какие — к премиальным. Этот анализ поможет лучше понять рыночные тенденции и предпочтения потребителей в сегменте подержанных автомобилей BMW.
Оформление
Для оформления данного проекта я выбрала визуальный стиль компании BMW в качестве источника вдохновения.

Основная информация
Датасет взят с платформы Kaggle, раздел «Used Cars Dataset» (BMW Used Cars on Kaggle)
Тематика: Данные о подержанных автомобилях BMW, выставленных на продажу в Великобритании.
Что содержит датасет:
model — модель BMW (например, 1 Series, X5, i8 и др.) year — год выпуска price — цена в фунтах стерлингов transmission — тип трансмиссии (автомат, механика и др.) mileage — пробег в милях fuelType — тип топлива (бензин, дизель, гибрид и т. д.) tax — налог на автомобиль mpg — расход топлива (миль на галлон) engineSize — объем двигателя
Об инструментах
Используемые инструменты включают библиотеку Pandas для загрузки и обработки табличных данных, NumPy для выполнения математических операций, Matplotlib для создания базовых графиков и визуализаций, Seaborn для расширенных визуализаций, таких как boxplot и heatmap, а также Plotly Express для создания интерактивных графиков.
Визуализация
В процессе работы с загруженным CSV файлом я импортировала необходимые библиотеки для анализа данных. Затем я проверила наличие пропусков в данных. В случае их обнаружения я планировала заменить пропуски средним значением для числовых столбцов или вставить заранее определенное значение для категориальных переменных. Однако в результате проверки пропусков в данных не оказалось.
После этого я приступила к анализу данных и созданию графиков, чтобы визуализировать информацию.
Для визуализации данных я выбрала несколько графиков:
1. Круговая диаграмма (для наглядного демонстрирования распределения трансмиссий).
2. Боксплот (для сравнения цен между различными типами топлива и моделями, подчеркивая медианные значения и разброс цен).
3. Столбчатая диаграмма (для отображения средней цены по моделям, что помогает выявить тренды и предпочтения среди потребителей).
4. Диаграмма рассеяния (для визуализации зависимости цены от года выпуска, позволяя проанализировать изменение стоимости автомобилей с течением времени).
5. Линейный график (для иллюстрации динамики пробега по годам выпуска, что помогает отслеживать тенденции и изменения в использовании автомобилей).
Бензиновые и дизельные машины доминируют в датасете, при этом гибриды и электрокары имеют более высокую медианную цену, что говорит о дороговизне современных технологий.
Четкая трендовая зависимость: более новые машины стоят дороже. Также видно, что механические и автоматические трансмиссии не дают явного отличия по цене, но их доля различается в годах.
Самые дорогие модели — M5, X7 и i8. Также наблюдаются сильные выбросы в некоторых моделях, что может говорить о редких комплектациях или тюнинге.
Ожидаемая зависимость: у более старых авто средний пробег выше. Но заметна тенденция к снижению пробега на новых авто, возможно, из-за роста лизинга и снижения длительности владения машиной.
Визуализация подтверждает: самые высокие средние цены — у моделей X7 и 8 Series. Это может быть полезно при сегментации клиентов по платежеспособности.
Большинство автомобилей BMW в выборке оснащены полуавтоматической трансмиссией, которая занимает около 40% выборки. Механика встречается заметно реже. Это отражает предпочтения покупателей на вторичном рынке, ориентированных на комфорт и удобство вождения.
Заключение
Проведенная аналитика показала, что:
Цена автомобиля BMW наиболее сильно зависит от года выпуска, пробега и объема двигателя.
Электрические и гибридные модели — самые дорогие, но их доля мала.
Есть четкая сегментация по моделям: 1 Series и 2 Series — доступные, X7 и i8 — премиальные.
Пробег закономерно снижается с уменьшением возраста авто.
Распределение цен и объемов двигателя указывает на популярность среднебюджетных моделей с умеренной мощностью.
Эти наблюдения могут быть основой для построения рекомендательных моделей, оценки остаточной стоимости и таргетинга по сегментам клиентов.