
Описание
Я выбрала датасет «Netflix Movies and TV Shows» с платформы Kaggle. Этот датасет содержит информацию о фильмах и телешоу, доступных на Netflix, включая названия, жанры, страны производства, даты добавления и многое другое.
Netflix — одна из самых популярных streaming-платформ в мире. Анализ этих данных позволяет понять, какие типы контента наиболее популярны, как меняется библиотека Netflix с течением времени, и какие страны активно производят контент для платформы.
Эти данные имеют ценность для анализа трендов в индустрии развлечений и могут быть полезны для создания рекомендаций для пользователей.
Типы графиков:
Гистограмма: Распределение количества фильмов и шоу по годам выпуска. Круговая диаграмма: Соотношение фильмов и телешоу. Столбчатая диаграмма: Топ-10 стран, производящих контент для Netflix. Линейный график: Динамика добавления контента на платформу по годам.
Этапы работы
Загрузка данных:
Данные были загружены из CSV-файла с использованием библиотеки Pandas.

Предварительный анализ данных:
Проверка на пропущенные значения и их обработка.
Преобразование дат в формат datetime.

Анализ данных:
Анализ распределения фильмов и шоу по годам выпуска.
Подсчёт количества фильмов и телешоу.
Определение топ-10 стран по производству контента.

Визуализация данных:
Использование библиотеки matplotlib и seaborn для создания графиков.
Стилизация графиков для создания единого визуального стиля.
Стилизация графиков:
Использование цветовой палитры Netflix (красный, чёрный, белый).
Добавление аннотаций и заголовков для улучшения читаемости.
Итоговые графики
Гистограмма: Распределение контента по годам выпуска:
Показывает, в какие годы было выпущено больше всего фильмов и шоу.
Круговая диаграмма: Соотношение фильмов и телешоу:
Показывает, какой тип контента преобладает на платформе.
Столбчатая диаграмма: Топ-10 стран по производству контента:
Показывает, какие страны являются лидерами по производству контента для Netflix.
Линейный график: Динамика добавления контента на платформу:
Показывает, как менялось количество добавленного контента с течением времени.
Ссылки на материалы
Описание применения генеративной модели
Использование ИИ: Для анализа текстовых данных (например, описаний фильмов) была использована модель GPT-4 для генерации ключевых слов и категоризации контента.
Промпты: «Сгенерируй ключевые слова для описания фильма: {описание}».
Ссылка на модель: https://openai.com/gpt-4
Заключение
Данные были успешно проанализированы, и на их основе созданы визуализации, которые помогают понять тренды в библиотеке Netflix.
Стилизация графиков в цветах Netflix делает их более привлекательными и узнаваемыми.
Проект демонстрирует навыки работы с данными, их анализ и визуализацию.