Анализ цен на авокадо в США (2015–2018) on Deziiign
Original size 896x1152

Анализ цен на авокадо в США (2015–2018)

PROTECT STATUS: not protected
The project is taking part in the competition

Я выбрала открытый датасет «Avocado Prices» с платформы Kaggle — он содержит еженедельные данные о ценах, объёмах продаж и типах авокадо (традиционные и органические) в 54 регионах США за период с 2015 по 2018 год.

Авокадо — символ современного здорового питания и «зелёного» тренда. Анализ его рынка позволяет увидеть географические и сезонные закономерности, а также проследить рост популярности органических продуктов.

big
Original size 1344x768

Изображение сгенерировано при помощи Nano Banana

Я построила 6 графиков:

4 стандартных (по заданию): линейный, гистограмма, столбчатый, круговая 1 дополнительный: «сезонные волны»

Такой набор позволяет показать данные не только как цифры, но и как явление культуры.

Очистка данных:

Удалила строку TotalUS (это итог по всем регионам, а не отдельный регион) Преобразовала колонку Date в формат даты с помощью pd.to_datetime () Выделила месяц отдельной колонкой для анализа сезонности.

big
Original size 1052x570

Линейный график

Original size 888x340

График 1: Средняя цена на авокадо

Original size 1386x528

Я использовала только простые цвета: green, lightgreen, darkgreen, чтобы не перегружать. На графиках добавила подписи прямо на столбики (например, $1.75), так удобнее смотреть.

Гистограмма

Original size 789x340

График 2: Как часто встречались разные цены?

Original size 1362x438

Столбчатый график

Каждый график строился отдельно: сначала я смотрела, что можно посчитать, потом как это визуализировать. Например, для «Топ-10 регионов» я сгруппировала данные по региону, посчитала среднюю цену и отсортировала.

Original size 690x440

График 3: Топ 10 регионов по цене

Original size 1324x736

Круговая диаграмма

Original size 1280x720

График 4: Какое авокадо чаще продается?

Original size 1066x436

График «Сезонные волны»

Original size 790x340
Original size 1502x700

Были применены следующие статистические методы:

Группировка (groupby), чтобы посчитать среднюю цену по регионам, месяцам, типам Фильтрация (df[df['type'] == 'organic']) для сравнения типов Агрегация (mean (), value_counts ()) для расчёта показателей Визуализация распределений: гистограммы и линейные графики показывают, как данные меняются.

Original size 1344x768

Изображение сгенерировано при помощи Nano Banana