
Описание проекта
Меня всегда интересовала тема цветов, а именно цветочных букетов и композиций, которые привносят радости и красок в нашу жизнь, особенно если их дарят как знак внимания.
Когда на сайте GitHub.com я искала датасет для анализа, я изначально знала, что он будет про цветы. Мне интересно узнать статистику, какие цветы чаще всего покупают, в каком формате они оформлены и есть ли какие-то взаимосвязи между количествами продаж и месяцами года.
Мне удалось найти недавнюю статистику продаж цветочного магазина, и я без сомнений решила ее анализировать.
Оформление графиков
Перед тем как приступить к структуризации данных и их анализу, я сгенерировала стилизованные цветочные букеты, чтобы определить цветовую палитру и эстетику моего исследования.


изображения сгенерированы нейросетью Midjorney (1), (2)
Свои графики я решила оформлять в розовых оттенках, которые извлекла из сгенерированных изображений при помощи сервиса Adobe Colour, после чего доработала вручную для получения объемной цветовой палитры в рамках одного розового цвета.
Таким образом, в цветовую палитру вошли цвета 8B475D, FFC0CB, FFD6E7, FFC0E6, FFF0F5, FFF5F8 а также градиенты, которые получились путем смешивания этих цветов.
Шрифт для оформления графиков был выбран из подгруженной библиотеки. Геометричный и легко читаемый DejaVu Sans.
(1) Generate a vector illustration in Adobe Illustrator style with a grainy effect, depicting a lush bouquet of Pink Peonies, Blush Spray Roses, Pink Astilbe.
(2) Generate a vector illustration in Adobe Illustrator style with a grainy effect, depicting a lush bouquet ofPink Garden Roses, Pink Ranunculus, Pink Lisianthus

цветовая палитра

изображение сгенерировано нейросетью Midjorney (3)
Во время изучения датасетов я выбирала графики наиболее наглядные и понятные для визуализации моих данных:
Круговая диаграмма Столбчатая диаграмма Тепловая карта Линейная диаграмма
(3) Generate a vector illustration in Adobe Illustrator style with a grainy effect, depicting a lush bouquet of Pink Peonies, Blush Spray Roses, Pink Astilbe
Графики
Первым шагом я подгрузила свой датасет о продажах цветочного магазина из CSV-файла, чтобы в программах задавать нудные мне параметры.
График № 1 распределение выручки по продуктам
Первоначально мне стало интересно, какие цветы и какой способ их упаковки приносят больше всего выручки. Для этого я использовала круговую диаграмму и смотрела на процентное соотношение выручки.
Как результат, на мое удивление, орхидеи в корзинке занимают большую долю. После чего следует букет пионов.
Загружаются данные о продажах цветочного магазина из CSV-файла. Создается новая колонка 'Revenue' (выручка), которая дублирует данные из 'Total Sales' Строится круговая диаграмма с данными из product_sales.values Настраиваем отображение процентов. Оформляем заголовок Сохраняем и отображаем
График № 2 топ-10 продуктов в продажах
Интересно, что доля продаж зависит и от стоимости букетов. Поэтому я решила проанализировать, какую сумму приносят продажи разных видов цветов. Для этого данные были оформлены в горизонтальную столбчатую диаграмму.
Как итог, 11 000 долларов с продажи орхидей в корзинке — максимальный показатель. А я и не думала, что орхидеи так долго стоят.
Построение горизонтальной столбчатой диаграммы для 10 продуктов. Настройка осей и подписей. Добавление сетки и значений на столбцах Форматирование оси Х. Сохранение и отображение
График № 3 интенсивность продаж по дням и месяца и месяцам
Также мне стало интересно проследить взаимосвязь продаж и сезонов. Для этого я выбрала тип диаграммы тепловая карта и ориентировалась на 3 параметра: число продажи, месяц, а также полученная выручка, ведь именно ее объем отражает количество продаж.
В коде были построены оси, на которых строились ячейки диаграммы и распределяли цветовые значения от блеклого к самому яркому.
Также был задан параметр, выделяющий самый интенсивный день продажи звездочкой.
В результате можно сделать вывод, что самым прибыльным днем было 20 мая. К сожалению, мне не удалось связать эту параллель с каким-то праздником. Если смотреть на показатели по месяцам, то самые интенсивные продажи наблюдаются в мае, декабре и феврале.
Загрузка и подготовка данных Создание сводной таблицы (pivot table) Структурирование данных Создание тепловой карты Настройка осей и подписей Создаем сетку вокруг каждой ячейки тепловой карты Выделяем максимальные значения Создаем легенду, объясняющую значение звезд
График № 4 выручка по типам клиентов и способам оплаты
Важный аспект в анализе продаж магазина — клиенты. Они бывают постоянные и новые. Я решила проследить, какую выручку магазин получает с постоянных клиентов, а какую с новых и какими способами оплаты они пользуются.
Загрузка и агрегация данных Подготовка данных для визуализации Создание фигуры и расчет параметров Построение линии для новых клиентов (Строим линейный график с кружками в качестве маркеров) Построение линии для постоянных клиентов Настройка осей и заголовка (Добавляем подписи осей с указанием единиц измерения) Настройка сетки и фона (Делаем сетку полупрозрачной и пунктирной) Корректировка масштаба оси Y (Расширяем верхнюю границу, чтобы текстовые метки не обрезались) Настройка легенды (Настраиваем цвет и стиль заголовка легенды)
В итоге, основную выручку магазин имеет с постоянных покупателей, она превышает выручку от новых клиентов больше, чем в два раза во всех аспектах способов оплаты.
Второй параметр (способ оплаты) показывает, что способ оплаты картой самый популярный, после чего идет оплата онлайн, в этих показателях новые и постоянные клиенты не отличаются.
Заключение
Таким образом, анализ датасета показал, что основная выручка цветочного магазина и в процентном, и в денежном соотношении приходится на корзинки с орхидеями, в то время как букет гвоздик показывает минимальные показатели.
Также важно отметить, что самыми продаваемыми месяцами являются февраль, май и декабрь, а самыми непередаваемым — апрель.
Основную выручку магазин имеет с постоянных покупателей, этот результат показывает, что он пользуется спросом, и люди туда частно возвращаются. А самый популярный способ оплаты — картой. В сумме с оплаты картой магазин имеет выручку 30 071 долларов от постоянных и новых клиентов.
Использованные нейросети
Midjorney — генерация обложки и нескольких изображений Deepseek — вопросы по коду Adobe Color — выявление цветов
Обложка: Generate a vector illustration in Adobe Illustrator style with a grainy effect, depicting a lush bouquet of Pink Peonies, Blush Spray Roses, Pink Astilbe.