
Я выбрала открытый датасет «Avocado Prices» с платформы Kaggle — он содержит еженедельные данные о ценах, объёмах продаж и типах авокадо (традиционные и органические) в 54 регионах США за период с 2015 по 2018 год.
Авокадо — символ современного здорового питания и «зелёного» тренда. Анализ его рынка позволяет увидеть географические и сезонные закономерности, а также проследить рост популярности органических продуктов.

Изображение сгенерировано при помощи Nano Banana
Я построила 6 графиков:
4 стандартных (по заданию): линейный, гистограмма, столбчатый, круговая 1 дополнительный: «сезонные волны»
Такой набор позволяет показать данные не только как цифры, но и как явление культуры.
Очистка данных:
Удалила строку TotalUS (это итог по всем регионам, а не отдельный регион) Преобразовала колонку Date в формат даты с помощью pd.to_datetime () Выделила месяц отдельной колонкой для анализа сезонности.

Линейный график
График 1: Средняя цена на авокадо
Я использовала только простые цвета: green, lightgreen, darkgreen, чтобы не перегружать. На графиках добавила подписи прямо на столбики (например, $1.75), так удобнее смотреть.
Гистограмма
График 2: Как часто встречались разные цены?
Столбчатый график
Каждый график строился отдельно: сначала я смотрела, что можно посчитать, потом как это визуализировать. Например, для «Топ-10 регионов» я сгруппировала данные по региону, посчитала среднюю цену и отсортировала.
График 3: Топ 10 регионов по цене
Круговая диаграмма
График 4: Какое авокадо чаще продается?
График «Сезонные волны»
Были применены следующие статистические методы:
Группировка (groupby), чтобы посчитать среднюю цену по регионам, месяцам, типам Фильтрация (df[df['type'] == 'organic']) для сравнения типов Агрегация (mean (), value_counts ()) для расчёта показателей Визуализация распределений: гистограммы и линейные графики показывают, как данные меняются.
Изображение сгенерировано при помощи Nano Banana