
Мне очень нравится смотреть фильмы и сериалы, именно этим чаще всего я занимаюсь в свободное время. Одним из самых крупных и интересных для меня стриминговых сервисов на сегодняшний день является Netflix. На сайте Kaggle я нашла датасет, в котором представлен список всех фильмов и телешоу, доступных на сервисе, а также такую информацию, как актёрский состав, режиссёры, рейтинги, год выпуска и продолжительность.
Я решила, что было бы интересно посмотреть на распределение кино по странам, количеству выпускаемых фильмов по годам, по продолжительности и распределение годов выпусков. Данные были визуализированы в виде круговой диаграммы, линейного графика столбчатой диаграммы и гистограммы, так как они наиболее подходящие к выбранной теме.
Выбор стилистики
Цветовая схема исследования была выбрана на основе официальной палитры заставки компании Netflix.

Заставка Netflix

Цветовая палитра по заставке
Импорт библиотек и загрузка данных
После загрузки датасета мы изучили его формат и типы данных
Обозначение общей палитры для будущих графиков
Круговая диаграмма
На этом этапе я создала признак: Распределение фильмов по странам, что позволило наглядно показать, что наиболее активная страна по созданию фильмов на Netflix — Соединенные штаты Америки.
Код для создания круговой диаграммы
Круговая диаграмма
Линейный график
Второй признак — количество выпускаемых фильмов по годам. Это помогло узнать, что примерно до 2019 года количество выпускаемых фильмов с каждым годом возрастало, а после стало убывать.
Код для создания линейного графика
Линейный график
Столбчатая диаграмма
Далее проводился анализ по количеству выпущенных фильмов по продолжительности. По выведенным данным самый частый тип — это сериал с длительностью в 1 сезон.
Код для создания столбчатой диаграммы
Столбчатая диаграмма
Гистограмма
За последний признак я взяла распределение по году выпуска. По графику видно, что пик выпущенного кино приходится на 2018–2019 года.
Код для создания гистограммы
Гистограмма
Итог работы
Проект выполнен строго по всем требованиям. Все этапы проанализированы, графики построены, выводы сделаны. Использовались только корректные, очищенные данные. Визуализация данных позволила мне применить навыки анализа, чтобы глубже разобраться в своём любимом стриминговом сервисе Netflix.
Описание применения генеративной модели
Использованные ресурсы: Нейросеть Qwen.AI: https://chat.qwen.ai/ — для создания обложки проекта.