
Описание проекта
Я выбрала для анализа датасет от Spotify на сайте Kaggle, так как сама люблю музыку и интересуюсь тем, как она сделана. В датасете представлены объективные параметры, по которым можно оценить треки (например, громкость или жанр), так что анализ лишен субъективности и все графики оценивают только форму композиций. В основном я анализировала зависимость одного параметра от другого, чтобы выявить взаимосвязи и закономерности
В проекте представлены столбчатые и линейная диаграммы
Обложка сгенерирована в нейросети Ideogram (prompt: spotify logo on the centre, abstract background, green and yellow colors, fancy picture, glowing particles)
Топ-5 самых громких жанров

Код для анализа зависимости громкости от жанра

Зависимость темпа от танцевальности музыки

Код для анализа зависимости темпа от танцевальности (взяты первые 10 самых танцевальных треков)
Мне было интересно посмотреть, действительно ли самые танцевальные треки обязательно должны быть в одинаково быстром темпе. Оказалось, что нет, однако 114 BPM (самое маленькое количество ударов в минуту, основываясь на этой таблице) все еще достаточно высокий показатель
Зависимость популярности трека от его инструментальности
Код для визуализации популярности инструментальных треков
В датасете отсортированы треки по уровню инструментальности в них, где 1 — полное отсутствие вокала, а 0 — преимущественнно вокал (например, реп). График показывает, что в основном люди любят песни, где есть слова, что-то среднее практически не пользуется популярностью, а чистый инструментал находится на втором месте по прослушиваниям в этой категории
Топ-10 самых добрых жанров
Код для анализа доброты
В датасете представлен параметр «valence», оценивающий позитивность и негативность трека. На графике представлены жанры с наивысшим значением «valence»
Так как в датасете один и тот же жанр встречается неограниченное количество раз, перед анализом удаляются все повторяющиеся элементы и из оставшихся выбираются 10 тех, у которых наивысшее значение «valence»