Original size 2856x4085

Исследование фильмов и сериалов от Netflix

PROTECT STATUS: not protected
The project is taking part in the competition

Мне очень нравится смотреть фильмы и сериалы, именно этим чаще всего я занимаюсь в свободное время. Одним из самых крупных и интересных для меня стриминговых сервисов на сегодняшний день является Netflix. На сайте Kaggle я нашла датасет, в котором представлен список всех фильмов и телешоу, доступных на сервисе, а также такую информацию, как актёрский состав, режиссёры, рейтинги, год выпуска и продолжительность.

Я решила, что было бы интересно посмотреть на распределение кино по странам, количеству выпускаемых фильмов по годам, по продолжительности и распределение годов выпусков. Данные были визуализированы в виде круговой диаграммы, линейного графика столбчатой диаграммы и гистограммы, так как они наиболее подходящие к выбранной теме.

Выбор стилистики

Цветовая схема исследования была выбрана на основе официальной палитры заставки компании Netflix.

big
Original size 5120x2880

Заставка Netflix

big
Original size 1920x988

Цветовая палитра по заставке

Импорт библиотек и загрузка данных

Original size 5120x1788

После загрузки датасета мы изучили его формат и типы данных

Original size 1668x164

Обозначение общей палитры для будущих графиков

Круговая диаграмма

На этом этапе я создала признак: Распределение фильмов по странам, что позволило наглядно показать, что наиболее активная страна по созданию фильмов на Netflix — Соединенные штаты Америки.

Original size 1028x607

Код для создания круговой диаграммы

Original size 642x658

Круговая диаграмма

Линейный график

Второй признак — количество выпускаемых фильмов по годам. Это помогло узнать, что примерно до 2019 года количество выпускаемых фильмов с каждым годом возрастало, а после стало убывать.

Original size 1500x546

Код для создания линейного графика

Original size 580x455

Линейный график

Столбчатая диаграмма

Далее проводился анализ по количеству выпущенных фильмов по продолжительности. По выведенным данным самый частый тип — это сериал с длительностью в 1 сезон.

Original size 1107x453

Код для создания столбчатой диаграммы

Original size 894x547

Столбчатая диаграмма

Гистограмма

За последний признак я взяла распределение по году выпуска. По графику видно, что пик выпущенного кино приходится на 2018–2019 года.

Original size 959x367

Код для создания гистограммы

Original size 580x455

Гистограмма

Итог работы

Проект выполнен строго по всем требованиям. Все этапы проанализированы, графики построены, выводы сделаны. Использовались только корректные, очищенные данные. Визуализация данных позволила мне применить навыки анализа, чтобы глубже разобраться в своём любимом стриминговом сервисе Netflix.

Описание применения генеративной модели

Использованные ресурсы: Нейросеть Qwen.AI: https://chat.qwen.ai/ — для создания обложки проекта.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more