Концепция

Наверное, каждый человек в наше перенасыщенное трагедиями время страдает от определенного количества паранойи. Кто не задумывался о том, опасен ли человек, идущий с нами по одной дороге ночью?
Но в таких ситуациях, мне кажется, нас пугает не сам человек, а неизвестность, которую он несет, непредсказуемость его действий.
Не существует «преступного лица». Приметы, по которой сразу можно определить опасность. Однако, я думаю, сам факт наличия информации, осведомленность, может успокоить, а также развеять некоторые мифы, связанные с представлениями об «опасных людях».
Выбранный для анализа датасет содержит информацию о людях, чьи имена и фамилии стали известны в связи с уголовными расследованиями.
Эта информация включает не только персональные данные, такие как место рождения и рост, но и более необычные подробности: татуировки, приметы, цвет глаз и волос, а также международные ордера на арест.
В анализе используются:
Пайчарт Столбчатые диаграммы Гистограмма Линейный график
Для оформления анализа я использовала приведенную ниже палитру. По моему мнению, она отлично передает некое холодящее ощущение, приходящее с размышлениями о серьезных преступлениях.
Гнило-зеленый напоминает о сырых тюрьмах и грязных вечерних улицах, темные оттенки напоминают о ночи, во время которой совершается большинство преступлений, и красный, конечно, отсылает к крови.

Подготовка данных
Для начала я импортировала библиотеки для анализа данных и визуализации и открыла датасет, который можно найти по ссылке в конце анализа. В нем представлена информация, актуальная на февраль 2021 год.
В датасете содержится информация о 2869 преступниках. Всего 16 колонок. Дубликатов нет, однако пропусков достаточно. Например, признак «отличительные черты» и «вес» отсутствует почти во всех наблюдениях, цвет глаз также не везде указан. Можно удалить колонки с наибольшим количеством пропусков, а затем удалить строчки с пропусками.
После обработки осталось почти 1200 преступников. По каждому есть информация, которую теперь я буду визуализировать.
График #1
Для данной информации я выбрала круговую диаграмму, так как она наиболее наглядно показывает заметную разницу в статистике между двумя категориями из общей популяции людей. Получается, что из 100 преступников 84 — мужчины, а 16 — женщины.
В данном случае стереотип о том, что опасный человек в большинстве случаев будет мужчиной, оказался оправдан.
График #2
Теперь меня заинтересовала география рождения преступников. Очень часто окружение человека влияет на его уровень агрессии. Возможно, существует некая корреляция между неблагополучностью родного города и уровнем преступности его резидентов.
Оказалось, что большинство преступников родилось в городе Грозный — столице Чеченской Республики. На графике я вижу, что название города встречается не один раз, а несколько — просто в разных формулировках. Итого, более 60 преступников родились в Грозном. В Москве — менее 10 человек.
Для данного типа данных столбчатая диаграмма является наиболее подходящей, поскольку позволяет легко сравнить количество рожденных между городами. На данном графике я также применила наклон подписей под 45 градусов, чтобы они не накладывались друг на друга.
График #3
Следующим шагом я решила построить гистограмму с целью узнать, как распределяется рост преступников.
Медианное значение роста — 173 сантиметра. Как видно из распределения, мода роста установилась на уровне 175 сантиметров. Минимальный рост — 155 сантиметров — вероятно, принадлежит женщине.
Распределение роста преступников напоминает распределение роста в России в принципе. Это разбивает стереотип о том, что высокие\массивные люди представляют больше опасности и с большей вероятностью проявят агрессию.
График #4
Теперь узнаем сколько лет самому старому и самому молодому преступнику и отобразим это на столбчатой диаграмме. При этом еще импортируем библиотеку datetime для обработки временных типов данных.
Самым старым преступником оказался Хачанянц Арнольд (81 год на сегодняшний день), а самой молодой преступницей — Саганабекова Айза (26 лет на сегодняшний день). К сожалению, мне не удалось найти о них информацию в открытых источниках.
Существует стереотип о том, что молодые люди и подростки зачастую совершают больше нападений и преступлений в принципе. Здесь мы можем увидеть, что это не так. Можно предположить, что степень серьезности преступлений увеличивается с возрастом.
График #5
Последнее, что я решила выяснить — это информация о количестве преступников, внесенных в базу розыска в зависимости от года. Для отображения информации по годам лучше всего подходит линейный график.
Оказалось, что больше всего преступников было внесено в базу в период с 2015 по 2020 года, а пиковое значение было достигнуто в 2016 году с более чем 300 преступниками.
Это может быть связано с кризисными событиями и множеством террактов, произошедших в 2016 году по всему миру. Статистически, растревоженное население, находящееся под давлением финансовых и моральных кризисов, с большей частотой порождает преступников.
То же самое может быть сказано об обострении криминальной активности в 2019 году, которое скорее всего было связано с началом пандемии, принесшей огромное количество тревоги и трагедий.
Ссылки и источники



