Original size 1856x2464

Что мы едим на новогодних праздниках? Анализ зимней еды

PROTECT STATUS: not protected

Я выбрала набор данных о зимней пище и напитках, который доступен на платформе Kaggle. Этот датасет включает информацию о различных продуктах, таких как супы, напитки и закуски, их ценах, калориях, рейтингах и сезонных характеристиках.

Проанализировать зимнюю еду интересно, так как в это время выставляются баснословные ценники на каждую позицию, ещё осенью стоившую как все. Откуда идёт такое ценообразование? Мне стало интересно выявить зависимости между ценами, калориями и рейтингами, а также выявить тренды потребления пищи зимой. Это поможет получить ценные инсайты для меня в области питания, чтобы в будущих проектах знать, что зимой нравится покупателям больше. Такие сведения могут стать ценными и для маркетологов, и для производителей продуктов.

В процессе анализа использовались различные виды графиков для более детального изучения данных:

Гистограммы для анализа распределения цен и калорийности продуктов. Это позволяет оценить, в каких пределах находятся значения.

Ящики с усами для сравнения различных характеристик продуктов по категориям, например, по типам продуктов, чтобы увидеть распределение, медиану, выбросы.

Точечные диаграммы для исследования взаимосвязей между ценой, рейтингом и другими характеристиками.

Тепловая карта для изучения корреляций между числовыми характеристиками, такими как цена, калории, рейтинг и популярность. Тепловая карта позволяет легко увидеть сильные и слабые взаимосвязи между данными.

Линейный график (line plot) для визуализации зависимостей между двумя переменными, например, зависимость цены от рейтинга.

big
Original size 1888x1008

Сначала я загрузила датасет и посмотрела на его первые строки, чтобы понять, как он устроен. Затем проверила, нет ли пропущенных значений и дубликатов, чтобы убедиться, что данные чистые. После этого посмотрела общую статистику по числовым столбцам, чтобы понять, как распределяются данные.

Затем я проверила, все ли столбцы имеют правильные типы данных, чтобы избежать ошибок в дальнейшем анализе. И, наконец, убедилась, что в данных нет пустых значений. Если бы они были, я бы их удалила или заполнила нужными данными.

Этот процесс подготовки данных важен для того, чтобы они были чистыми и подходили для анализа и создания графиков.

Original size 1273x275

Визуализация

Я выбрала максимально новогоднюю палитру цветов для вызова ассоциаций с этим праздником. Решила закрашивать только внутреннюю часть графика, чтобы получился оммаж на кружку, внутри которой находится напиток, или на мандарин, который лежит на белом столе.

График № 1

Original size 1536x706

На графике видно распределение продуктов по категориям: супы, напитки и закуски. Напитков в датасете оказалось больше всего, за ними следуют закуски и супы. Это может говорить о том, что зимнее время включает больше продуктов для утоления жажды или согревающих напитков, чем для легких закусок или супов. Вывод: зимняя еда часто включает напитки как основной продукт для утоления жажды или создания тепла, что соответствует потребностям в холодное время года.

Original size 861x592

График № 2

Original size 2024x668

После анализа распределения категорий продуктов, я решила исследовать цены на них. Видно, что большинство товаров сосредоточено в ценовых пределах от 6 до 10 долларов, что может свидетельствовать о наиболее популярных и доступных ценах для зимних продуктов. Также можно заметить, что в диапазоне выше 10 долларов количество продуктов резко снижается, что говорит о меньшей популярности более дорогих зимних продуктов.

Original size 851x587

График № 3

Original size 2094x582

На этом графике изображена корреляция между четырьмя характеристиками зимних продуктов: ценой, калориями, рейтингом и популярностью.

Мы видим, что цена и калории имеют умеренную положительную корреляцию (0.26). Это может означать, что более калорийные продукты имеют тенденцию быть чуть дороже, хотя связь не слишком сильная. Однако, цена и рейтинг продуктов имеют отрицательную корреляцию (-0.35), что указывает на то, что более дорогие продукты не всегда имеют более высокие рейтинги. Напротив, цена и популярность практически не связаны, что говорит о том, что цена не сильно влияет на привлекательность продукта для потребителей.

Еще интересная деталь: калории и рейтинг также имеют слабую отрицательную корреляцию (-0.33), что может указывать на то, что продукты с большим количеством калорий не всегда имеют высокие рейтинги. Это может быть связано с предпочтениями потребителей, которые склонны отдавать предпочтение менее калорийным, но более вкусным продуктам.

Original size 774x553

Графики № 4-6

0

Далее я решила сравнить разные типы продуктов по некоторым факторам. Оказалось, например, что цена выше 10 долларов чаще отпугивает, а калорийность напитков и закусок схожа. Супы, как правило, менее калорийные по сравнению с другими типами продуктов. Странно, но цена на зимние продукты немного увеличивается в 2024 году по сравнению с 2023, а затем снова снижается в 2025. Это может указывать на сезонные колебания и изменение спроса в разные годы.

0

График № 7

Original size 2062x550

График показывает зависимость калорийности продуктов от их цены. Из него видно, что связь между этими двумя переменными почти отсутствует: распределение калорий по ценам хаотичное, без четкой закономерности. Можно выделить несколько продуктов с высокой калорийностью, цена которых варьируется, но в целом, цена не влияет напрямую на количество калорий в продукте. Это может свидетельствовать о том, что выбор продуктов в зимний период зависит от разных факторов, а не только от цены или калорийности.

Original size 867x592

График № 8

Original size 2088x626

Заметна общая тенденция: с каждым годом становится все больше качественных товаров, хотя они и увеличиваются в цене. График помогает понять, что, хотя более дорогие продукты (в диапазоне 10-15 долларов) могут иметь такие же высокие рейтинги, как и более дешевые (5-7 долларов), высокие цены не всегда связаны с высоким рейтингом. В частности, продукты из зим 2023 и 2025 годов имеют более широкий диапазон цен и рейтинг, что может указывать на различие в потребительских предпочтениях по сезонам.

Original size 1026x741

График № 9

Original size 2242x554

Этот график сочетает в себе гистограмму и кривую, что помогает проанализировать распределение цен по категориям продуктов (супы, напитки, закуски). Мы видим, что напитки преимущественно сосредоточены в ценовом диапазоне от 6 до 8 долларов, в то время как супы чаще встречаются в более низкой ценовой категории (от 2 до 6 долларов). Закуски занимают промежуточное положение, с ценами около 8 долларов.

То есть напитки имеют более широкое распределение цен по сравнению с супами, которые сосредоточены в меньшем диапазоне цен (на них мы состояние не делаем, значит). Кривая, отражающая общий тренд для всех продуктов, указывает на наибольшее количество продуктов в ценовом диапазоне от 8 до 12 долларов, что на самом деле не мало. Люди готовы платить за одну позицию в меню от 10 долларов, если она связана с сезоном и большим праздником.

Original size 1006x741

График № 10

Original size 2038x672

Этот график показывает, как цена зимних продуктов соотносится с двумя другими характеристиками: рейтингом и популярностью. Из графика видно, что рейтинг (зеленая линия) имеет тенденцию к стабилизации и небольшим колебаниям, не показывая явной зависимости от цены. Напротив, линия популярности (красная) значительно более изменчива, что может указывать на более прямое влияние цены на интерес к продуктам. При этом на более дорогих продуктах (от 10 долларов и выше) популярность снижается, несмотря на изменения рейтинга. Это может означать, что более дорогие продукты могут быть менее популярны среди покупателей, несмотря на высокие оценки.

Original size 1014x741

Выводы, а точнее рекомендации для всех продавцов/маркетологов/дизайнеров этой ниши

Напитки пользуются большим спросом в зимний период, в то время как супы и закуски находятся на втором плане. Это подсказывает, что более разнообразные и универсальные товары, которые можно съесть или выпить на ходу, следует продвигать активнее в зимний сезон. Также важно учитывать, что цена продуктов обычно колеблется в пределах от 6 до 10 долларов, что делает их доступными для большинства потребителей. Однако, дорогие продукты не пользуются такой же популярностью, и поэтому маркетологам и производителям стоит подумать о стратегии ценообразования для повышения их привлекательности.

При этом калорийность продуктов не всегда зависит от их цены, что важно учитывать при позиционировании продуктов как здоровых или калорийных. Наблюдается определенная стабильность в ценах и категориях продуктов по сезонам, однако с каждым годом меняется предпочтение потребителей. Эти данные помогут выстроить более точные маркетинговые стратегии, оптимизировать ценовую политику и сделать акцент на тех продуктах, которые вносят наибольший вклад в прибыль, сохраняя баланс между ценой, калорийностью и популярностью.

Вкусной еды и хороших праздников! Не смотрите на калории и цены, главное атмосфера :)

А просмотреть коды и датасет →

Обложка была выполнена через Midjourney

Что мы едим на новогодних праздниках? Анализ зимней еды
Project created at 14.01.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more