Фильмы и телешоу Netflix на Deziiign

Описание

Я выбрала датасет «Netflix Movies and TV Shows» с платформы Kaggle. Этот датасет содержит информацию о фильмах и телешоу, доступных на Netflix, включая названия, жанры, страны производства, даты добавления и многое другое.

Netflix — одна из самых популярных streaming-платформ в мире. Анализ этих данных позволяет понять, какие типы контента наиболее популярны, как меняется библиотека Netflix с течением времени, и какие страны активно производят контент для платформы.

Эти данные имеют ценность для анализа трендов в индустрии развлечений и могут быть полезны для создания рекомендаций для пользователей.

Типы графиков:

Гистограмма: Распределение количества фильмов и шоу по годам выпуска. Круговая диаграмма: Соотношение фильмов и телешоу. Столбчатая диаграмма: Топ-10 стран, производящих контент для Netflix. Линейный график: Динамика добавления контента на платформу по годам.

Этапы работы

Загрузка данных:

Данные были загружены из CSV-файла с использованием библиотеки Pandas.

Исходный размер 701x81

Предварительный анализ данных:

Проверка на пропущенные значения и их обработка.

Преобразование дат в формат datetime.

Исходный размер 684x127

Анализ данных:

Анализ распределения фильмов и шоу по годам выпуска.

Подсчёт количества фильмов и телешоу.

Определение топ-10 стран по производству контента.

Исходный размер 695x45

Визуализация данных:

Использование библиотеки matplotlib и seaborn для создания графиков.

Стилизация графиков для создания единого визуального стиля.

Исходный размер 701x125

Стилизация графиков:

Использование цветовой палитры Netflix (красный, чёрный, белый).

Добавление аннотаций и заголовков для улучшения читаемости.

Исходный размер 653x129

Итоговые графики

Исходный размер 1019x554

Гистограмма: Распределение контента по годам выпуска:

Показывает, в какие годы было выпущено больше всего фильмов и шоу.

Исходный размер 636x660

Круговая диаграмма: Соотношение фильмов и телешоу:

Показывает, какой тип контента преобладает на платформе.

Исходный размер 1019x629

Столбчатая диаграмма: Топ-10 стран по производству контента:

Показывает, какие страны являются лидерами по производству контента для Netflix.

Исходный размер 1019x554

Линейный график: Динамика добавления контента на платформу:

Показывает, как менялось количество добавленного контента с течением времени.

Ссылки на материалы

Датасет: https://www.kaggle.com/datasets/shivamb/netflix-shows

Блокнот с кодом: https://colab.research.google.com/drive/16Jn7CcTTPbl3breflEzw13S82DOMLj5x#scrollTo=9dPKBh6A8GeX

Облачное хранилище: https://drive.google.com/drive/folders/1a_9gFSKWE6WwUfKXOuPKZAn3-PXFh9Vy?usp=sharing

Описание применения генеративной модели

Использование ИИ: Для анализа текстовых данных (например, описаний фильмов) была использована модель GPT-4 для генерации ключевых слов и категоризации контента.

Промпты: «Сгенерируй ключевые слова для описания фильма: {описание}».

Ссылка на модель: https://openai.com/gpt-4

Заключение

Данные были успешно проанализированы, и на их основе созданы визуализации, которые помогают понять тренды в библиотеке Netflix.

Стилизация графиков в цветах Netflix делает их более привлекательными и узнаваемыми.

Проект демонстрирует навыки работы с данными, их анализ и визуализацию.