Original size 1550x2400

Фильмы и телешоу Netflix

PROTECT STATUS: not protected
5

Описание

Я выбрала датасет «Netflix Movies and TV Shows» с платформы Kaggle. Этот датасет содержит информацию о фильмах и телешоу, доступных на Netflix, включая названия, жанры, страны производства, даты добавления и многое другое.

Netflix — одна из самых популярных streaming-платформ в мире. Анализ этих данных позволяет понять, какие типы контента наиболее популярны, как меняется библиотека Netflix с течением времени, и какие страны активно производят контент для платформы.

Эти данные имеют ценность для анализа трендов в индустрии развлечений и могут быть полезны для создания рекомендаций для пользователей.

Типы графиков:

Гистограмма: Распределение количества фильмов и шоу по годам выпуска. Круговая диаграмма: Соотношение фильмов и телешоу. Столбчатая диаграмма: Топ-10 стран, производящих контент для Netflix. Линейный график: Динамика добавления контента на платформу по годам.

Этапы работы

Загрузка данных:

Данные были загружены из CSV-файла с использованием библиотеки Pandas.

big
Original size 701x81

Предварительный анализ данных:

Проверка на пропущенные значения и их обработка.

Преобразование дат в формат datetime.

big
Original size 684x127

Анализ данных:

Анализ распределения фильмов и шоу по годам выпуска.

Подсчёт количества фильмов и телешоу.

Определение топ-10 стран по производству контента.

big
Original size 695x45

Визуализация данных:

Использование библиотеки matplotlib и seaborn для создания графиков.

Стилизация графиков для создания единого визуального стиля.

Original size 701x125

Стилизация графиков:

Использование цветовой палитры Netflix (красный, чёрный, белый).

Добавление аннотаций и заголовков для улучшения читаемости.

Original size 653x129

Итоговые графики

Original size 1019x554

Гистограмма: Распределение контента по годам выпуска:

Показывает, в какие годы было выпущено больше всего фильмов и шоу.

Original size 636x660

Круговая диаграмма: Соотношение фильмов и телешоу:

Показывает, какой тип контента преобладает на платформе.

Original size 1019x629

Столбчатая диаграмма: Топ-10 стран по производству контента:

Показывает, какие страны являются лидерами по производству контента для Netflix.

Original size 1019x554

Линейный график: Динамика добавления контента на платформу:

Показывает, как менялось количество добавленного контента с течением времени.

Ссылки на материалы

Описание применения генеративной модели

Использование ИИ: Для анализа текстовых данных (например, описаний фильмов) была использована модель GPT-4 для генерации ключевых слов и категоризации контента.

Промпты: «Сгенерируй ключевые слова для описания фильма: {описание}».

Ссылка на модель: https://openai.com/gpt-4

Заключение

Данные были успешно проанализированы, и на их основе созданы визуализации, которые помогают понять тренды в библиотеке Netflix.

Стилизация графиков в цветах Netflix делает их более привлекательными и узнаваемыми.

Проект демонстрирует навыки работы с данными, их анализ и визуализацию.

Фильмы и телешоу Netflix
5
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more