Original size 1140x1600

Анализ Disney+

PROTECT STATUS: not protected

Концепция проекта

Disney+ — одна из самых популярных стриминговых платформ в мире, которая предлагает огромное количество фильмов, сериалов и другого контента. Анализ данных этой платформы позволяет понять, какие тенденции существуют в индустрии развлечений, и какие типы контента наиболее востребованы.

Понимание структуры контента Disney+ может быть полезно для маркетологов, продюсеров и создателей контента, которые хотят лучше ориентироваться в предпочтениях аудитории.

Я всегда был большим фанатом Disney. С детства меня вдохновляли их фильмы, мультфильмы и сериалы, которые не только развлекали, но и учили важным жизненным ценностям. Когда у меня появилась возможность проанализировать данные, я сразу подумал о Disney+, потому что это платформа, которая объединяет всё, что я люблю: классические мультфильмы, фильмы Marvel, Star Wars и многое другое.

Какие данные вы выбрали и где вы их нашли?

Данные: Информация о контенте на Disney+ (фильмы, сериалы, рейтинги, жанры, годы выпуска и т. д.) на сайте Kaggle.

Какой вид графиков вы решили сделать?

1. Круговые диаграммы (распределение типов контента).

2. Столбчатые диаграммы (распределение рейтингов и жанров).

3. Линейные графики (количество выпусков по годам).

4. Интерактивные графики с использованием Plotly для более детального анализа.

Этапы работы

1. Загрузка данных 2. Анализ данных 3. Обработка пропущенных значений 4. Визуализация данных

import pandas as pd try: …df = pd.read_csv ('disney_plus_titles.csv') except Exception as e: …print (f"Ошибка при чтении файла: {e}»)

Описание: Загрузка данных из CSV-файла и обработка возможных ошибок.

print («Информация о данных:») custom_info (df)

Описание: Получение общей информации о данных (количество строк, столбцов, типы данных).

missing_values = df.isnull ().sum ().rename_axis ('Колонка').reset_index (name='Количество пропусков') print (tabulate (missing_values, headers='keys', tablefmt='pretty', stralign='left'))

Описание: Подсчёт пропущенных значений в каждом столбце.

import plotly.express as px fig = px.pie (df, names='type', title='Распределение типов контента на Disney+') fig.show ()

Описание: Создание круговой диаграммы для анализа распределения типов контента.

Итоговые графики

Original size 1920x975

Круговая диаграмма, показывающая процентное соотношение фильмов и сериалов на Disney+.

Original size 758x94
Original size 1398x525

Горизонтальная столбчатая диаграмма, показывающая количество контента для каждого рейтинга.

Original size 1082x161
Original size 1398x525

Горизонтальная столбчатая диаграмма, показывающая самые популярные жанры на Disney+.

Original size 982x166
Original size 1398x525

Линейный график, показывающий количество выпусков контента по годам.

Original size 1265x215
Original size 1398x525

Горизонтальная столбчатая диаграмма, показывающая страны, которые производят больше всего контента для Disney+

Original size 992x256

Заключение

1. Большая часть контента на Disney+ — это фильмы. 2. Наиболее распространенные рейтинги — TV-G, TV-PG и G. 3. Самые популярные жанры — это комедии, семейные фильмы и анимация. 4. Количество выпусков значительно увеличилось с 2010-х годов. 5. Больше всего контента производится в США, Индии и Великобритании.

Использование нейросетей

Для создания обложки я использовал нейросеть leonardo.ai с промтом: «disney castle as hacker pattern »

https://leonardo.ai/

Скачать датасет и код

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more