Original size 1140x1600

Анализ датасета из kaggle Airplane Crashes 🛫

PROTECT STATUS: not protected

Концепция

Для меня всегда было интересно, насколько феномен судьбы реален, можно ли «пачкать» карму, в особенности всегда мучал вопрос, насколько можно предугадать «несчастливый» самолет, или несчастный случай от меня никак не зависит? При поиске датасета, я остановилась на статистике авиакрушений. Я часто летаю и я выберу этот датасет для анализа.

Типы созданных графиков

  1. Круговая диаграмма с интерактивными элементами (библиотека plotly.express)
  2. Столбчатый график
  3. Хороплет для визуализаций локации
  4. Сабплот для визуализации нескольких признаков попарно между собой
  5. Гоуплот (фигура Pie)

Этапы работы

Этапы работы:

  1. Выбор данных, которые интересно проанализировать, предобработка данных
  2. Анализ данных
  3. Визуализация Оформление графиков: В оформлении графиков я использовала серые градиенты как метафору на траурность.

Описание датасета

The available dataset is about Airplane Crashes throughout the world since 1908. Датасет об авиакатастрофах мира с 1908 года.

Сделаю общую предобработку (импорт библиотек, анализ, препроцессинг и т. д.)

big
Original size 2878x308
big
Original size 2866x120
big
Original size 1806x880
Original size 2150x684
Original size 1264x546

Много пропущенных значений, и тут я подумала, а почему бы не начать визуализацию параллельно преобработке.

Для визуализации выберу серые оттенки, так как они о траурности, а авиакатастрофы это и вправду что-то в разрезе титанически ужасного, я попросила ChatGpt «преобразовать строку моего кода в визуализацию данных в серых оттенках, напиши код для хитмэпа, чтобы задействовать градацию серого"(промт). Да, я выбрала для этого хитмэп, так как он более релевантен

Original size 1338x174
Original size 2282x568

Теперь выделю топ_5, используя те же цвета, используя пай чарт, так как он удобный в рассмотрении и анализе небольшого количества признаков, попросила ChatGpt «написать код с теми же признаками, но изменить тип графика на круглый и интерактивный и в разных оттенках серого"(промт)

Original size 1368x466

Приступим к чистке и дальнешей предобработке, поменяю информацию о дате на корректную запись

Original size 862x138

Поделю название компаний и заполню пропуски

Original size 1746x718

Настало время анализа по признакам, выберу локацию и кол-во происшествий, чтобы проверить теорию о Бермудском треугольнике

Original size 1234x164
Original size 852x730

Теория не подтвердилась, а вот факт про Москву стал тревожить

Original size 1268x424
Original size 1522x1342

Итоги

Пассажиры и погибшие: В среднем, на борту разбившегося самолета было около 27 человек, из которых около 20 погибли. В некоторых случаях на борту находилось до 644 человек, а число погибших достигало 583. Наземные жертвы: В среднем, сообщалось о 1,6 наземных жертвах. Один инцидент отличался необычайно высоким числом — 2 750 наземных погибших. Месяц и год: Аварии в наборе данных происходили в период с 1908 по 2009 год, при этом средним месяцем для аварий был июнь. Охват годов в наборе данных позволяет проводить потенциальный анализ тенденций аварий во времени. Оператор, тип и производитель: Набор данных предоставляет информацию о наиболее распространенных операторах, типах воздушных судов и производителях, участвовавших в авариях. Например, «Американская воздушная почтовая служба» имела наибольшее число происшествий — 26, а модель «De Havilland DH-4», производимая «De», также имела 26 происшествий. Эти сведения могут помочь выявить закономерности или сосредоточить дальнейший анализ на конкретных операторах, типах или производителях.

Построим теперь географический график, которые будет интерактивный и группирующий локацию и тип происшествия

Original size 2004x174
Original size 1220x688
Original size 1208x140

Попрошу ChatGpt «преобразовать анализ в визуализацию на карте, используя модуль choropleph"(промт), выбрала этот модуль, так как это наиболее показательно и понятнее для восприятия + логично для анализа с признаком по локации

Original size 2376x154

Теперь топ30 по локации + количества происшествий, выбираю круглую интерактивную диаграмму, так как она интересней в визуализации, к тому же использование градиента серого упрощает восприятие, я попросила ChatGpt «из моего кода (нижняя ячейка) сделать визуализацию круглой интерактивной диаграммы в серых цветах"(промт)

Original size 1370x128
Original size 2786x918
Original size 1488x1144

Самое страшное — узнать, какая авиакомпания самая небезопасная, построю для этого обычный бар чарт, но добавлю интерактивность с помощью ChatGpt «сделай из моего стобчатого графика интерактивный в серых оттенках"(промт)

Original size 2502x776
Original size 2792x772

О, нет, только не Аэрофлот!!!!!

Напоследок, посмотрю зависимости типов катастроф (в небе/на земле), даты, года, фатальности. попрошу ChatGpt «написать код для нескольких зависимостей ('Aboard', 'Fatalities', 'Ground', 'Month', 'Year') в серых оттенках"(промт)

Original size 1342x202
Original size 2468x1230

Итак, анализ данных об авиакатастрофах предоставили ценные сведения о факторах, способствующих таким инцидентам.

Очевидно, что непрерывные усилия по сбору данных, анализу и внедрению мер безопасности имеют решающее значение для смягчения рисков, связанных с авиаперевозками. Используя выводы, полученные в результате анализа авиакатастроф, авиационная отрасль может работать над улучшением протоколов безопасности, обучением, процедурами технического обслуживания и технологическими достижениями для обеспечения более безопасного будущего авиаперевозок. Полученные в ходе этого анализа выводы несомненно сыграют жизненно важную роль в определении направления развития авиационной безопасности в будущем, надеюсь я смогла внести вклад в предотвращение «несчастных» рейсов

Я использовала ChatGPT 4

Анализ датасета из kaggle Airplane Crashes 🛫
Project created at 25.09.2024
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more