Original size 1550x2400

Фильмы и телешоу Netflix

PROTECT STATUS: not protected

Описание

Я выбрала датасет «Netflix Movies and TV Shows» с платформы Kaggle. Этот датасет содержит информацию о фильмах и телешоу, доступных на Netflix, включая названия, жанры, страны производства, даты добавления и многое другое.

Netflix — одна из самых популярных streaming-платформ в мире. Анализ этих данных позволяет понять, какие типы контента наиболее популярны, как меняется библиотека Netflix с течением времени, и какие страны активно производят контент для платформы.

Эти данные имеют ценность для анализа трендов в индустрии развлечений и могут быть полезны для создания рекомендаций для пользователей.

Типы графиков:

Гистограмма: Распределение количества фильмов и шоу по годам выпуска. Круговая диаграмма: Соотношение фильмов и телешоу. Столбчатая диаграмма: Топ-10 стран, производящих контент для Netflix. Линейный график: Динамика добавления контента на платформу по годам.

Этапы работы

Загрузка данных:

Данные были загружены из CSV-файла с использованием библиотеки Pandas.

big
Original size 701x81

Предварительный анализ данных:

Проверка на пропущенные значения и их обработка.

Преобразование дат в формат datetime.

big
Original size 684x127

Анализ данных:

Анализ распределения фильмов и шоу по годам выпуска.

Подсчёт количества фильмов и телешоу.

Определение топ-10 стран по производству контента.

big
Original size 695x45

Визуализация данных:

Использование библиотеки matplotlib и seaborn для создания графиков.

Стилизация графиков для создания единого визуального стиля.

Original size 701x125

Стилизация графиков:

Использование цветовой палитры Netflix (красный, чёрный, белый).

Добавление аннотаций и заголовков для улучшения читаемости.

Original size 653x129

Итоговые графики

Original size 1019x554

Гистограмма: Распределение контента по годам выпуска:

Показывает, в какие годы было выпущено больше всего фильмов и шоу.

Original size 636x660

Круговая диаграмма: Соотношение фильмов и телешоу:

Показывает, какой тип контента преобладает на платформе.

Original size 1019x629

Столбчатая диаграмма: Топ-10 стран по производству контента:

Показывает, какие страны являются лидерами по производству контента для Netflix.

Original size 1019x554

Линейный график: Динамика добавления контента на платформу:

Показывает, как менялось количество добавленного контента с течением времени.

Ссылки на материалы

Описание применения генеративной модели

Использование ИИ: Для анализа текстовых данных (например, описаний фильмов) была использована модель GPT-4 для генерации ключевых слов и категоризации контента.

Промпты: «Сгенерируй ключевые слова для описания фильма: {описание}».

Ссылка на модель: https://openai.com/gpt-4

Заключение

Данные были успешно проанализированы, и на их основе созданы визуализации, которые помогают понять тренды в библиотеке Netflix.

Стилизация графиков в цветах Netflix делает их более привлекательными и узнаваемыми.

Проект демонстрирует навыки работы с данными, их анализ и визуализацию.

Фильмы и телешоу Netflix
Project created at 02.04.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more