
Введение
Я взала датасет «Titanic: Machine Learning from Disaster» с Kaggle. Он содержит информацию о пассажирах Титаника: выживаемость, класс, возраст, пол, стоимость билета и т. д. Ссылка: https://www.kaggle.com/c/titanic/data
Я хотела узнать отношение выживших и разделение по полу, классу кают и другим параметрам.
Типы диаграмм
В рамках исследования я использовала следующие типы диаграмм:
Работа с данным датасетом позволяет выявить зависимость выживаемости пассажиров «Титаника» от пола, класса кают и других характеристик, а также наглядно показать влияние социальных факторов на исход катастрофы.
Предобработка данных

Цветовая палитра
Цветовая палитра
График 1

Данная диаграмма показывает общее соотношение выживших и погибших пассажиров «Титаника». Видно, что большинство людей не пережили катастрофу, что наглядно отражает масштаб трагедии и служит отправной точкой для дальнейшего анализа факторов, повлиявших на выживаемость.
График 1
График 2

Диаграмма показывает распределение пассажиров «Титаника» по классам кают. Наибольшее количество пассажиров находилось в третьем классе, тогда как первый и второй классы были представлены значительно меньшим числом людей. Это важно учитывать при дальнейшем анализе выживаемости.
График 2
График 3

Гистограмма показывает распределение возраста пассажиров «Титаника». Основная часть пассажиров находилась в возрасте от 20 до 30 лет, при этом медианный возраст составляет около 26 лет. Также можно заметить присутствие как детей, так и пожилых людей, что отражает разнообразный возрастной состав пассажиров.
График 3
График 4

Диаграмма демонстрирует различия в выживаемости пассажиров «Титаника» в зависимости от пола. Женщины имели значительно более высокий процент выживших, тогда как среди мужчин доля погибших была существенно выше. Это подтверждает влияние правила «женщины и дети — вперёд» при эвакуации.
График 4
График 5

Диаграмма отражает зависимость выживаемости пассажиров «Титаника» от класса кают. Пассажиры первого класса имели наибольшие шансы на выживание, тогда как в третьем классе доля погибших была значительно выше. Это указывает на влияние социального статуса и условий размещения на исход катастрофы.
График 5
График 6

Диаграмма сравнивает возрастное распределение выживших и погибших пассажиров «Титаника». Видно, что медианный возраст выживших ниже, чем у погибших, что указывает на более высокие шансы на спасение у молодых пассажиров и детей.
График 6
Результат исследования
Графики 7 и 8


Программы для графиков 7 и 8
Анализ данных показывает, что на выживаемость пассажиров «Титаника» сильнее всего влияли пол и класс кают. Женщины и пассажиры первого класса имели наибольшие шансы на спасение, тогда как в третьем классе выживаемость была значительно ниже.