Original size 1140x1600

Анализ данных популярности фильмов на Netflix

PROTECT STATUS: not protected
2

Введение


Выбранные данные:

Я выбрал датасет о фильмах на Netflix. Он содержит информацию о названиях, годах выпуска, оценках, количестве голосов, длительности, жанрах и странах производства.

Источник:

Данные были взяты из открытого источника «Kaggle» и представлены в формате CSV-файла под названием Best Movies Netflix.csv.


ПОЧЕМУ ИМЕННО ФИЛЬМЫ НЕТФЛИКС?


Анализ данных о фильмах на Netflix позволяет понять предпочтения аудитории и выявить наиболее популярные жанры. Это особенно ценно для создания рекомендаций по контенту и улучшению зрительского опыта.

Понимание, какие фильмы и жанры наиболее популярны, помогает предсказывать тренды и планировать контентные стратегии для платформы, а так же позволяет сделать некоторые выводы для себя и со стороны обычного зрителя платформы.


ВЫБОР ТИПОВ ГРАФИКОВ


Я решил использовать различные типы графиков, чтобы наглядно представить данные и сделать анализ более доступным и понятным:

• Линейные графики: Для отображения изменений в популярности жанров по годам.

• Столбчатые диаграммы: Для сравнения средних оценок по жанрам и странам производства.

• Точечные графики: Для анализа взаимосвязи между количеством голосов и продолжительностью на оценки фильмов.


Графики

big
Original size 4500x2400

Линейный график

Original size 1145x434

Код линейного графика «Изменение популярности жанров по годам»

Изменение популярности жанров по годам

•Использована область с настраиваемыми цветами из палитры tab20. •Добавлена прозрачность 0.8 для улучшения визуального восприятия. •Заголовки и метки осей стилизованы с использованием жирного шрифта и измененных цветов. •Добавлены сетки с измененной прозрачностью.

Original size 3600x1800

Столбчатая диаграмма

Original size 1145x434

Средняя оценка по жанрам

•Использована столбчатая диаграмма с кастомным цветом (teal) и черной окантовкой для лучшей видимости. •Заголовки и метки осей стилизованы, добавлены сетки.

Original size 3600x1800

точечный график

Original size 1145x434

код точечного графика «Влияние колличества голосов на оценку фильма»

Влияние количества голосов на оценку

•Использован точечный график с цветовой палитрой coolwarm. •Применена логарифмическая шкала для оси X и добавлены черные границы для маркеров. •Все текстовые элементы и сетка также кастомизированы.

Original size 3600x1800

Столбчатая диаграмма

Original size 1145x434

код столбчатой диаграммы «Средняя оценка фильмов по странам производства»

Средняя оценка по странам производства

•Аналогично предыдущему столбчатому графику, использован кастомный цвет (coral) с черными границами. •Весь текст стилизован с использованием жирного шрифта. •Добавлена сетка.

Original size 3600x1800

точечный график

Original size 1145x434

код для точечного графика «Влияние продолжительности фильмов на оценку»

Влияние продолжительности на оценку

•Использован точечный график с цветовой палитрой viridis. •Увеличен размер маркеров (100), добавлена прозрачность и черная окантовка. •Включена легенда и стилизованы заголовки и метки осей.

Выводы исследования


•Популярность жанров по годам:

Драма, комедия и триллер остаются лидерами по популярности. Документальные фильмы показывают рост популярности в последние годы.


•Средняя оценка по жанрам:

Документальные фильмы и боевики получили самые высокие оценки. Мюзиклы и спортивные фильмы имеют низкие оценки.


•Средняя оценка по странам производства:

Фильмы из США и Великобритании получают самые высокие оценки. Индийские и турецкие фильмы имеют более низкие оценки.


•Влияние продолжительности на оценку:

Фильмы около 120 минут получают высокие оценки. Очень короткие и длинные фильмы оцениваются ниже.


•Влияние количества голосов на оценку:

Больше голосов — выше оценка. Популярные фильмы, как правило, лучше оцениваются.



Исследование показало, что на Netflix наибольшей популярностью пользуются документальные фильмы, научная фантастика и военные фильмы. Эти жанры показывают стабильный рост популярности, привлекая внимание все большего числа зрителей. Напротив, комедии и боевики теряют свою актуальность, что свидетельствует о смене предпочтений аудитории. Фильмы, произведенные в Канаде и Великобритании, получают наивысшие оценки, что подчеркивает важность высокого качества производства и влияния культурных стандартов. Оптимальная длительность фильма составляет около 120 минут, что способствует удержанию интереса зрителей и получению положительных отзывов. Более популярные фильмы, собравшие много голосов, обычно оцениваются выше, что подтверждает, что качество и интерес зрителей идут рука об руку.

Для нас, как исследователей, это подчеркивает важность мониторинга трендов и изменений в предпочтениях зрителей. Анализ популярных жанров показывает, что нужно активно адаптировать контент, предлагая зрителям больше материалов в жанрах, которые сейчас находятся на пике популярности. Понимание этих динамик позволяет создавать контент, который лучше соответствует ожиданиям аудитории и помогает поддерживать интерес зрителей на высоком уровне.


Код для всех графиков

Описание применения генеративной модели

В данном проекте была использована мультимодальная модель GPT-4o, для поимка датасета и изучения принципов работы с графиками.

Для генерации обложки была использована DALLE-3 и topaz ai для поднятия разрешения картинки.

Промт: Create a sophisticated vertical poster for a professional presentation analyzing the popularity of movie genres on Netflix. The poster should feature a muted color palette. At the top, display a subtle area chart showing the changes in popularity of various movie genres over the years. Below that, include bar charts depicting average movie ratings by genre and by country of production, using muted tones. The bottom section should contain scatter plots illustrating the relationship between movie duration and ratings, and number of votes to ratings, with a refined, modern aesthetic. The overall design should be sleek and minimalistic, focusing more on the visual data and less on text.

Анализ данных популярности фильмов на Netflix
2
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more