Original size 1240x1800

Анализ распределения персонажей по расам в Властелине колец

PROTECT STATUS: not protected
The project is taking part in the competition

Выбор данных

Для выполнения проекта был выбран классический датасет kaggle, содержащий информацию о гендерном распределение внутри рас в «Властелине колец».

Выбор этого датасета обусловлен несколькими причинами:

- данные являются структурированными и компактными, что удобно для первичного анализа

-в датасете присутствуют как числовые признаки, так и категориальная переменная (раса), что позволяет использовать разные типы визуализации.

Круговая диаграмма рас

big
Original size 1198x939
big
Original size 810x887

Распределение персонажей по расам (Race Distribution)

Тип диаграммы: Круговая (pie chart) или горизонтальная столбчатая (bar chart) Данные: Поле race Идея: Показать, сколько персонажей принадлежит каждой расе — люди, эльфы, гномы, хоббиты, орки, маиар и т. д. Дополнительно: Можно выделить цветом основные «расы Средиземья» (люди, эльфы, гномы, хоббиты) и объединить остальных в «другие». Польза: Наглядно демонстрирует, на кого больше всего внимания уделено в каноне.

Горизонтальная групповая столбчатая диаграмма показывающая гендерное распределение среди рас

Original size 1193x926
Original size 779x969

Гендерный баланс по расам (Gender Distribution Across Races)

Тип диаграммы: Групповая столбчатая диаграмма или тепловая карта (heatmap) Данные: Поля gender и race Идея: Для каждой расы показать, сколько мужчин и женщин представлено. Например:

Среди хоббитов — почти поровну
Среди гномов — почти все мужчины (по канону)
Среди эльфов — больше упомянутых женщин (Галадриэль, Лутиэн и др.)

Польза: Показывает гендерные особенности мира Толкина — например, «почему мало женщин-гномов».

Диаграмма средней продолжительности жизни по расам

Original size 998x602
Original size 677x889

Что показывает график:

Горизонтальная столбчатая диаграмма.
Каждый столбец — одна раса.
Длина столбца — средний возраст (в годах) представителей этой расы.
Цвет — соответствует канонической ассоциации (например, хоббиты — зелёные, гномы — золотые).
На конце каждого столбца — точное значение среднего возраста.

Показывает, какие расы живут дольше в мире Толкина. Подчёркивает разницу между людьми, полуэльфами и драконами. Визуально интуитивно понятен — чем длиннее столбец, тем дольше живёт раса.

Древовидная карта с распределением персонажей по королевствам

Original size 1186x790
Original size 847x775

Что делает этот код:

Фильтрует персонажей без realm
Считает, сколько персонажей связано с каждым королевством
Объединяет редкие королевства (менее 3 персонажей) в «Other»
Строит Treemap, где:
    Размер блока = количество персонажей
    Подпись = название \+ число в скобках (например, «Gondor (42)»)
    Цвета — из палитры tab20 (20 различных цветов)

В ходе выполнения проекта был проведён первичный анализ датасета kaggel. Были построены четыре различных типа графиков, каждый из которых позволил рассмотреть данные под разным углом: распределение значений, сравнение средних, анализ разброса и изучение взаимосвязей между признаками.

Полученные визуализации показали, как разнообразен мир Толкина. Это подтверждает, что визуальный анализ является важным этапом исследования данных и может служить основой для более сложных методов анализа и классификации.

Использование инструментов искусственного интеллекта при работе над проектом.

В процессе выполнения проекта использовались инструменты искусственного интеллекта, а именно ChatGPT и среда Google Colab, в качестве вспомогательных средств для отладки кода и устранения технических ошибок.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more