Original size 564x761

Анализ датасета «Taylor Swift»

PROTECT STATUS: not protected

Описание

Для данного проекта с сайта Kaggle я взяла набор данных о Тейлор Свифт.

Я очень люблю Тейлор Свифт и мы с друзьями часто не можем решить, что закинуть в плейлист для наших посиделок, поэтому мне этот датасет очень откликается и будет круто потом использовать эти данные (особенно такие свежие) для наших посиделок.

Анализ датасета с такими признаками позволяет извлечь ценную информацию о музыкальном контенте и артисте. Например, по признакам danceability, energy и loudness можно оценить общую энергетику песен и их танцевальность, что поможет сформировать плейлисты для различных настроений и событий.

Типы созданных графиков:

  1. стилизованная столбчатая диаграмма в пастельных оттенках
  2. интерактивная (библиотека plotly.express) Bar chart со стилизованными колонками (группировка признаков, такой график наиболее релевантен во всех случаях)

Этапы работы: 1.Выбор данных, которые интересно проанализировать, предобработка данных 2.Анализ данных 3.Визуализация

Оформление графиков: В оформлении столбчатых графиков я использовала различные стилизации в пастельные цвета, так как именно с такой атмосферой у меня ассоциируется музыка моего любимого исполнителя!

Описание датасета

Этот набор данных охватывает все альбомы, выпущенные известной американской артисткой Тейлор Свифт, включая данные по 6 июня 2024 года. Самое последнее дополнение к этой коллекции — «The Tortured Poets Department: The Anthology» с 31 треком.

Набор данных был сгенерирован с использованием библиотеки Python SpotiPy и предоставлен в первозданном, нефильтрованном и сыром состоянии, что делает его идеальным для обучения моделей, анализа данных или визуализационных проектов.

Сделаю общую предобработку (импорт библиотек, поверхностный анализ и тд)

Original size 1280x943

Импорт библиотек.

Original size 670x774

Чистка дубликатов.

Original size 710x668

Все становится куда лучше. Сейчас я почищу данные.

Например, я выяснила, что ссылки столбец с айди артиста мне вообще неважен, поэтому уберу его, чтобы посмотреть на визуализацию.

Original size 1280x191

Убираю столбец с айди артиста.

Original size 1280x943

Чтобы вновь вдохновиться Тейлор, я проанализирую, насколько она плодотворна, и какой альбом у нее самый емкий.

Original size 1280x393

Анализ данных.

Я стилизовала график, попросив ChatGpt «сделать градиент, где самые емкие альбомы самого темного оттенка розового, самые маленькие — светлые»

Original size 1280x566

Нам, кстати, очень важно, чтобы музыка была «доброй», поэтому важно, чтобы я подобрала для ребят именно такую музыку, поэтому я строю таблицу и анализирую ее.

Original size 1280x246
Original size 1280x1073

Убедилась, что музыка по большей части добрая, выявлю теперь топ 5 альбомов с только такой музыкой, на случай, если нас будут слышать соседи, с заботой о них.

Original size 1280x623
Original size 1064x1020

Еще для нас важно иногда устраивать не просто ламповые посиделки, но и танцевальный движ, это тоже проанализирую.

Original size 1280x328

Тут попросила ChatGpt покрасить мне график в разные цвета и сделать его интерактивным, он это сделал импортировав библиотеку plotly.graph_objects.

Original size 1280x838
Анализ датасета «Taylor Swift»
Project created at 25.09.2024
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more