Original size 2375x3333

BTS Data Story

PROTECT STATUS: not protected

Вводная часть

Для анализа я выбрал датасет «BTS 147 Songs Audio Features (Spotify)» с платформы Kaggle. Данные собраны через Spotify API в ноябре 2021 года и содержат 147 песен с 17  аудиохарактеристиками: танцевальность, энергичность, громкость, акустичность, темп, валентность и другие.

Original size 4167x2165

фото участников группы BTS

BTS является одним из самых влиятельных музыкальных коллективов современности, чья дискография охватывает широкий спектр жанров — от хип-хопа до поп-баллад и EDM. Анализ объективных аудиопараметров позволяет выявить неочевидные закономерности и проследить эволюцию звучания группы вне субъективных оценок.

Цели и задачи

Цель: проанализировать аудиохарактеристики песен BTS и выявить тренды в эволюции их звучания.

Задачи: — Загрузить и подготовить данные из Spotify API — Построить графики для анализа динамики характеристик — Выявить корреляции между параметрами — Сравнить треки и альбомы между собой — Оформить всё в едином фиолетовом стиле BTS — Сформулировать выводы на основе полученных данных

Типы графиков

• Линейный график — эволюция характеристик по годам • Горизонтальная столбчатая диаграмма — топ-10 самых энергичных песен • Тепловая карта — корреляция аудиохарактеристик • Диаграмма рассеяния — танцевальность vs  позитивность • Круговая диаграмма — распределение песен по альбомам • Облако слов — частотность слов в названиях песен

Визуализация данных

Цветовое решение проекта продиктовано самой темой. BTS и их фандом ARMY неразрывно связаны с фиолетовым цветом — он стал символом связи между группой и поклонниками. Фраза «I  purple you» (я люблю тебя), придуманная участником V, превратила фиолетовый в цвет поддержки, доверия и единства.

Я хотела, чтобы визуальный стиль проекта отражал эту связь — фиолетовый должен был стать не просто случайным цветом, а смысловым ядром всей визуализации проекта.

Original size 1806x426

На этапе разработки визуального стиля я обратилась к ChatGPT с задачей подобрать цветовую гамму для проекта. Мой промпт звучал так:

«Предложи цветовую палитру для проекта о BTS. Нужны оттенки фиолетового — от тёмного до светлого. Фон должен быть чёрным или тёмно-фиолетовым. Цвета должны ассоциироваться с группой и фандомом ARMY. Нужно 5– 7 оттенков с кодами HEX.»

Original size 2748x1082

Я установила библиотеку kagglehub с поддержкой pandas для загрузки датасета напрямую с Kaggle, а затем импортировала все необходимые библиотеки: pandas для работы с табличными данными, numpy для математических расчётов, matplotlib и seaborn для построения графиков и тепловой карты, а также отключила предупреждения, чтобы вывод был чистым.

Я загрузила датасет с аудиохарактеристиками песен BTS напрямую с Kaggle через библиотеку kagglehub, используя адаптер для pandas, и вывела первые 5  строк, чтобы проверить, что данные загрузились корректно и посмотреть на структуру таблицы.

Original size 812x916

Я подготовила данные: добавила год релиза, перевела длительность в минуты, удалила дубликаты. Затем создала фиолетовую палитру и настроила стиль графиков под единое оформление.

График 1

Original size 2046x548

Линейный график показывает, как менялись танцевальность, энергичность, позитивность и акустичность с 2013 по 2021  год.

Результат: Пик энергичности и танцевальности — 2017– 2018 (эра Love Yourself). Акустичность снижается, позитивность растёт.

Original size 1189x589

Также видно, что акустичность со временем снижается, а позитивность, наоборот, растёт, особенно заметный скачок произошёл в 2020  году, вероятно, под влиянием альбома BE, который группа выпустила в пандемийный период с целью поддержать слушателей.

График 2

Original size 1912x548
Original size 1116x690

Второй график — зависимость между танцевальностью и позитивностью. Это диаграмма рассеяния, где каждая точка представляет отдельную песню. По горизонтальной оси отложена танцевальность, по вертикальной — позитивность. Цвет точек соответствует году релиза, а размер — энергичности трека. График показал, что жёсткой зависимости между этими двумя характеристиками нет. Песни с высокой танцевальностью могут быть как позитивными, например «Boy With Luv», так и грустными или тревожными, как «Fake Love» или «Black Swan». Также заметно, что более поздние годы (2020–2021) имеют больший разброс значений, что говорит о расширении жанрового диапазона группы.

График 3

Original size 1972x380
Original size 860x790

Третий график — распределение песен по альбомам. Это круговая диаграмма, которая показывает, какую долю в датасете занимает каждый альбом. Я подсчитала количество песен в каждом альбоме и визуализировала пропорции. Больше всего треков оказалось в альбомах «Love Yourself: Answer» — 20% и «BE» — 18%. Это объясняется тем, что «Answer» является компиляцией, объединяющей треки из двух предыдущих частей серии, а «BE» — полноформатным альбомом с большим количеством треков. «Love Yourself: Her» и «Map of the Soul: 7» также занимают значительную долю.

4 график

Original size 1190x590

Четвёртый график — распределение темпа песен BTS. Это гистограмма, которая показывает, в каком темповом диапазоне чаще всего работают авторы. По горизонтальной оси отложен темп в ударах в минуту (BPM), по вертикальной — количество песен. Я добавила вертикальные линии среднего и медианного значения. График показал, что большинство песен BTS находятся в диапазоне 80–140 BPM. Средний темп составляет 110 BPM, медиана — 108 BPM. Это подтверждает жанровое разнообразие группы: от медленных песен до быстрых и ярких танцевальных треков.

Облако слов

Пятый график — облако слов из названий песен BTS. Это дополнительная визуализация, которую я создала для завершения проекта. Облако слов показывает, какие слова чаще всего встречаются в названиях песен группы. Я обработала все названия, удалила стоп-слова (предлоги, артикли, общие слова вроде «the», «and», «for»), а затем визуализировала частотность: чем чаще слово встречается, тем крупнее оно отображается. Самыми частыми словами стали: love, soul, dream, light. Эти слова отражают ключевые темы творчества BTS — любовь, мечты, душаи свет.

Само облако я выполнила в форме сердца — символа фандома ARMY, а в центре разместила надпись BTS. Все слова окрашены в оттенки фиолетового, от тёмного к светлому, что поддерживает единый стиль проекта.

Original size 1189x1190

Заключение

Выбранные данные оказались содержательными и объёмными: 147 песен и 17 аудиохарактеристик позволили провести глубокий анализ эволюции звучания BTS с 2013 по 2021 год.

Я тщательно изучила данные: добавила год релиза, удалила дубликаты, провела корреляционный анализ, агрегировала данные по годам, рассчитала средние и экстремальные значения. Каждый график сопровождается содержательным выводом на основе цифр.

Что показали графики:

  1. Эволюция звучания — пик энергичности и танцевальности пришёлся на 2017–2018 годы (эра Love Yourself), акустичность снижается, позитивность растёт.

  2. Танцевальность и позитивность — жёсткой связи нет, песни с высокой танцевальностью могут быть как позитивными, так и грустными. Более поздние годы имеют больший разброс значений.

  3. Распределение по альбомам — больше всего треков в Love Yourself: Answer (20%) и BE (18%).

  4. Распределение темпа — большинство песен в диапазоне 80–140 BPM, средний темп 110 BPM.

Для стилизации я разработала уникальную фиолетовую палитру в цветах ARMY. Все графики выполнены на темно-фиолетовом фоне с белым текстом, цвета заданы кодом. Визуальное оформление выдержано в едином стиле.

Original size 464x580
Original size 1550x558
Original size 1386x548

участники группы BTS

Описание применения генеративной модели

Использованные модели: DeepSeek — https://chat.deepseek.com ChatGPT (OpenAI) — https://chat.openai.com

— ИИ помог написать код для всех графиков. При возникновении ошибок (например, KeyError: ’release_date’ или KeyError: ’album’) ИИ объяснил, какие колонки есть в датасете, и предложил правильные названия.

— Создание анимации логотипа DeepSeek и ChatGPT написали код для анимированного логотипа BTS с эффектами пульсации линий и текста, перелива фиолетовых цветов, вращающихся светящихся точек.

— Облако слов в форме сердца ИИ помог создать облако слов из названий песен в форме сердца с надписью BTS в центре, используя библиотеку wordcloud и маску сердца.

— Цветовая палитра По моему запросу ИИ предложил фиолетовую палитру в стиле BTS, объяснил выбор каждого цвета и помог настроить глобальный стиль matplotlib.

— Формулировка выводов и текстовое оформление ИИ помог структурировать выводы по каждому графику, написать вводную часть, описание этапов работы, заключение и оформить текст в соответствии с критериями презентации.

Искусственный интеллект выступал в роли технического ассистента: помогал писать и отлаживать код, предлагал стилистические решения, структурировал текст. Все ключевые решения — выбор датасета, постановка исследовательских вопросов, интерпретация полученных данных, итоговые выводы и общая концепция презентации — принимались мной самостоятельно.

BTS Data Story
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more