
Введение
В этом проекте я провела анализ дата-сета, созданного для отслеживания песен, которые попадают в топ-50 песен на музыкальной платформе Spotify, дата-сет ежедневно обновляется. Анализ позволяет узнать, что объединяет самые популярные песни, и какой должна быть песня, чтобы попасть в топ и оставаться в нем длительное время.
Мой выбор данных основан на моей любви к музыке, как популярной, так и менее известным артистам. Анализ данного дата-сета был для меня любопытным исследованием, из которого я узнала, что является фактором успеха для трека. Это буквально дата-сет, в котором собраны все данные для того, чтобы понять, каким ты должен написать свой трек, если хочешь, чтобы он стал вирусным.

логотип музыкальной платформы Spotify
Выбор стиля визуализации данных и внешний вид графиков основаны на логотипе Spotify — одной из самых популярных музыкальных платформ, которую автор дата-сета использует для сбора данных.

Обработка данных
Я импортировала дата-сет с kaggle.com, а затем импортировала библиотеки для обработки данных — numpy, pandas, matplotlib.pyplot.
Импротирование дата-сета и нужных библиотек
Визуализация
График 1. Топ 10 самых популярных песен в US за 2025 год
Несмотря на то, что Spotify является шведской компанией, чаще всего в рекомендациях попадаются американские исполнители, а также чаще занимают лидирующие позиции в чартах, поэтому в первую очередь мне было интересно узнать, какие артисты популярны в США, есть ли там артисты из других стран. Выборка данных произведена за 2025 год, так как я хотела узнать о текущей ситуации в музыкальных чартах.
Код для оформления и построения столбчатой диаграммы
График 2. Наличие нецензурной лексики в песнях
В этой диаграмме я задействовала красный цвет для более явного отличия категорий.
Данные, выведенные этой круговой диаграммой, меня удивили, так как я была уверена, что большинство современных артистов в топах, часто прибегают к использованию нецензурной лексики в своих текстах, поэтому я была приятно удивлена этим процентным соотношением.
Код для оформления и построения круговой диаграммы
График 3. Распределение изменения позиций за неделю
Было так же любопытно узнать, что в основном, большинство треков остается на одной и той же позиции в топе в течение целой недели. С учетом того, насколько быстро сменяются тренды в современном мире, данные гистограммы меня удивили.
Гистограмма в градиентных оттенках показалась мне интересным решением для отображения количества треков.
Код для оформления и построения гистограммы
График 4. Зависимость популярности от длительности песни
Диаграмма рассеяния показалась мне интересным решением для того, чтобы показать большой массив данных за один раз. Основное скопление точек указывает на то, что в средняя продолжительность трека, который попадет в топ, 3,5 минуты.
Код для оформления и построения диаграммы рассеивания
Я решила также привести график, отражающий менее обширную выборку данных. Для удобства, я взяла лишь 5% от всего дата-сета, чтобы проверить данные еще раз и убедиться в том, что расчет средней продолжительности для популярного трека верен.
Код для построения и оформления диаграммы с сэмплированными данными
График 5. Изменение популярности топ-3 песен в 2025 году
Также мне показалось интересным узнать, какие три песни были самыми популярными в начале 2025 года. Любопытно было сравнить, насколько мои музыкальные предпочтения совпали с другими слушателями, какие треки были выбраны людьми для того, чтобы вступить в новый год и задать себе настроение и энергию.
Код для оформления и построения линейного графика
Список источников
Top Spotify Songs in 73 Countries (Daily Updated) by ASANICZKA