
Введение
В этом проекте проанализирован датасет об индексе гендерного неравенства по странам за 2021 год. Этот анализ помог определить, в каких странах практически отсутствует гендерное неравенство, а также понять, как количество девушек в парламенте зависит от рейтинга страны. Также было выявлено соотношение женщин и мужчин, получивших среднее образование, и соотношение работающих женщин и мужчин. Я проверила, зависит ли процент работающих девушек от индекса гендерного неравенства.
На эту тему меня вдохновил социальный проект «ТыНеОдна», который поддерживает женщин и помогает им справиться с насилием.

Мудборд
Внешний вид графиков и стиль проекта вдохновлены яркими и мотивирующими иллюстрациями про девушек и их силу. Розовые оттенки — отсылают к женственности, красные — к борьбе за равенство.
В исследовании использованы данные с сайта Kaggle. Датасет содержит информацию для каждой страны о том, какой у нее уровень развития, индекс гендерного неравенства, рейтинг, уровень материнской смертности, процент женщин в парламенте, процент работающих женщин и некоторую другую информацию.
Для анализа применены такие данные, как индекс гендерного неравенства, процент женщин в парламенте, рейтинг страны, процент женщин и процент мужчин, получивших среднее образование, процент работающих женщин и процент работающих мужчин.
Данные представлены в виде гистограммы, чтобы наглядно видеть наименьшее и наибольшее значение, круговых диаграмм, чтобы понять соотношение мужчин и женщин, точечных диаграмм для отображения взаимосвязи данных.
Использование библиотек
В коде использованы библиотека pandas для работы с csv-файлом, matplotlib.pyplot для основной визуализации данных, библиотека googletrans для перевода англоязычных данных.
Обработка данных
В датасете на месте некоторых значений были пропуски, поэтому к числовым данным сначала была применена проверка, чтобы привести их к корректному типу.
Сортировка данных
Создание объекта переводчика
Потом — построение основы графика.
Настройка внешнего вида графика — фон, оси, метки, значения, заливка.
Визуализация
Топ-10 стран с низким идексом гендерного неравенства. Гистограмма
Индекс гендерного неравенства (Gender Inequality Index, GII) измеряет степень неравенства между мужчинами и женщинами в трех ключевых областях: репродуктивное здоровье, расширение прав и возможностей и экономическое участие. Чем ниже значение GII, тем меньше неравенство. В топ-10 стран с самым низким показателем вошли — Дания, Норвегия, Швейцария, Швеция, Нидерланды, Финляндия, Сингапур, Исландия, Люксембург, Бельгия.
Зависимость доли женщин в парламенте от рейтинга страны. Точечная диаграмма
Чем выше страна находится в рейтинге, тем больше процент женщин в парламенте, что говорит о гендерном равенстве в развитых странах.
Соотношение девушек и мужчин, получивших среднее образование. Круговая диаграмма
Статистика весьма положительная, поскольку показатели практически равны.
Зависимость процентна работающих женщин от индекса гендерного неравенства. Точечная диаграмма
В странах с меньшим индексом гендерного неравенства невсегда женщин работает больше чем в странах с более высоким индексом. Часто происходит такая ситуация, что в стране с высоким уровнем неравенства почти всем женщинам приходится работать из-за тяжелого экономического положения страны.
Соотношение работающих женщин и мужчин по миру. Круговая диаграмма
Пока число работающих мужчин на 17% больше, но женщины также активно работают.
Описание применения генеративной модели
Обложка для проекта была сгенерирована в Midjourney.
Промпт: minimalistic illustration associated with girl power, background is #EC6C66, elements are pink and white --ar 1240:1773 --v 6.1
Ссылка на модель: https://www.midjourney.com
Список источников
Выгрузка данных с Kaggle (URL: https://www.kaggle.com/datasets/gianinamariapetrascu/gender-inequality-index) Просмотрено: 20.03.2025.