
Выбор данных
В качетстве исходдных данных я использовала датасет из Kaggle под названием «Netflix Movies and TV Shows». Данные о фильмах и телешоу могут быть полезны для анализа трендов и предпочтений пользователей. Кроме того датасет содержит информацию о различных параметрах, таких как жанр, дата выпуска, страна и рейтинг, что позволяет провести разнообразный анализ. Я буду использовать такие графики как: график подсчета, диаграмма рассеяния, столбчатая диаграмма, скрипичный график
Использование нейросети
Нейросеть OpenAi Промпт: мне необходимо провести анализ данных, предложи три варианта датасета для анализа, и скажи какие параметры можно проанализировать. Кроме того мне нужно пять графиков, предложи их. Сделай наброски для уникального оформления этих графиков



Анализ данных и визуализация
Предварительная обработка данных, с помощью Pandas:
Предварительный анализ данных:
Очистка данных от дубликатов, аномалий, пропущенных пунктов:
Визуализация данных
1. Количество фильмов и телешоу (Тип графика — «Count Plot»)
2. Сравнение года выпуска и рейтинга (Тип графика — «Scatter Plot»)
3. Жанры фильмов и телешоу (Тип графика — «Bar Plot»)
4. Сравнение рейтингов фильмов и телешоу (Тип графика — «Violin Plot»)
Выводы по графикам
1. График подсчета показывает, что на платформе Netflix больше фильмов, чем телешоу. Это указывает, что фокус компании на кинопроизводстве, которое направленно на более молодую аудиторию, но также присутствуют телешоу, чтобы у зрителей любого возраста было желание пользовать платформой Netflix.
2. Диаграмма рассеяния показывает, что большинство фильмов и телешоу на Netflix были выпущены в последние годы, что соответствует стратегии компании по поддержанию актуального контента. Это также нам говорит о том, что платформа активно развивается и делает все, чтобы идти в ногу со временем.
3. Столбчатая диаграмма показывает, что жанры, такие как драмы и комедии, наиболее популярны на Netflix, как среди фильмов, так и среди телешоу. Данные жанры кино и телешоу являются самыми популярными в мире из этого исходит, что Netflix делает ставку на массового потребителя.
4. Скрипичный график показывает, что рейтинги фильмов и телешоу на Netflix достаточно высокие и равномерно распределены относительно друг друга, это значит, что большинство фильмов и сериалов на платформе имеют высокий рейтинг.
Заключение
Анализ данных из Netflix Movies and TV Shows показал, что платформа активно расширяет свой контент, включая как фильмы, так и телешоу. Визуализации в виде графиков помогли нам лучше понять тренды и предпочтения пользователей Netflix. Использование графиков и диаграмм позволяет увидеть статистику и провести анализ для дальнейшей работы с полученной информацией например: драма и комедия самые популярные жары, значит мы будем снимать их чаще, тем самым удовлетворяя потребность зрителей. Графики и диаграммы необходимы для хорошей работы любой компании.
Ссылки на блокнот и датсет