
Концепция проекта
Disney+ — одна из самых популярных стриминговых платформ в мире, которая предлагает огромное количество фильмов, сериалов и другого контента. Анализ данных этой платформы позволяет понять, какие тенденции существуют в индустрии развлечений, и какие типы контента наиболее востребованы.
Понимание структуры контента Disney+ может быть полезно для маркетологов, продюсеров и создателей контента, которые хотят лучше ориентироваться в предпочтениях аудитории.
Я всегда был большим фанатом Disney. С детства меня вдохновляли их фильмы, мультфильмы и сериалы, которые не только развлекали, но и учили важным жизненным ценностям. Когда у меня появилась возможность проанализировать данные, я сразу подумал о Disney+, потому что это платформа, которая объединяет всё, что я люблю: классические мультфильмы, фильмы Marvel, Star Wars и многое другое.
Какие данные вы выбрали и где вы их нашли?
Данные: Информация о контенте на Disney+ (фильмы, сериалы, рейтинги, жанры, годы выпуска и т. д.) на сайте Kaggle.
Какой вид графиков вы решили сделать?
1. Круговые диаграммы (распределение типов контента).
2. Столбчатые диаграммы (распределение рейтингов и жанров).
3. Линейные графики (количество выпусков по годам).
4. Интерактивные графики с использованием Plotly для более детального анализа.
Этапы работы
1. Загрузка данных 2. Анализ данных 3. Обработка пропущенных значений 4. Визуализация данных
import pandas as pd try: …df = pd.read_csv ('disney_plus_titles.csv') except Exception as e: …print (f"Ошибка при чтении файла: {e}»)
Описание: Загрузка данных из CSV-файла и обработка возможных ошибок.
print («Информация о данных:») custom_info (df)
Описание: Получение общей информации о данных (количество строк, столбцов, типы данных).
missing_values = df.isnull ().sum ().rename_axis ('Колонка').reset_index (name='Количество пропусков') print (tabulate (missing_values, headers='keys', tablefmt='pretty', stralign='left'))
Описание: Подсчёт пропущенных значений в каждом столбце.
import plotly.express as px fig = px.pie (df, names='type', title='Распределение типов контента на Disney+') fig.show ()
Описание: Создание круговой диаграммы для анализа распределения типов контента.
Итоговые графики
Круговая диаграмма, показывающая процентное соотношение фильмов и сериалов на Disney+.
Горизонтальная столбчатая диаграмма, показывающая количество контента для каждого рейтинга.
Горизонтальная столбчатая диаграмма, показывающая самые популярные жанры на Disney+.
Линейный график, показывающий количество выпусков контента по годам.
Горизонтальная столбчатая диаграмма, показывающая страны, которые производят больше всего контента для Disney+
Заключение
1. Большая часть контента на Disney+ — это фильмы. 2. Наиболее распространенные рейтинги — TV-G, TV-PG и G. 3. Самые популярные жанры — это комедии, семейные фильмы и анимация. 4. Количество выпусков значительно увеличилось с 2010-х годов. 5. Больше всего контента производится в США, Индии и Великобритании.
Использование нейросетей
Для создания обложки я использовал нейросеть leonardo.ai с промтом: «disney castle as hacker pattern »
Скачать датасет и код