
Концепция
Депрессия среди студентов — это одна из проблем психического здоровья, которая существенно влияет на качество жизни и академическую деятельность молодых людей. В последние годы депрессия среди студентов становится все более распространенной, особенно в условиях увеличивающегося академического давления и социальной изоляции. Это подчеркивает актуальность исследования этой проблемы, так как депрессия может не только снизить качество жизни студентов, но и существенно повлиять на их успеваемость и адаптацию в учебной среде.

В своем анализе я использовал Depression Student Dataset, предоставленный пользователем Kagle [1]. Датасет содержит в себе данные о оценочном состоянии студентов.
Для вдохновения я обращался к своему личному опыту и изображениям в темных тонах, которые передают бездну бесконечного давления.

Для визуализации данных я выбрал круговую диаграмму (наглядно показывает соотношение студентов с депрессией и без неё), гистограмму (хорошо показывает разброс в возрастной группе), виоловая диграмма (позволяет легко увидеть плотность данных и различия между двумя категориями), столбчатая диаграмма (позволяет наглядно сравнить количество студентов с депрессией и без, в зависимости от уровня давления) и площадно-линейный график (помогает визуализировать, как изменяется количество учебных часов в зависимости от уровня академического давления, выделяя общие тренды и закономерности.)
Обработка данных
В самом начале я импортировал библиотеки: seaborn, matplotlib.pyplot и pandas. После чего считал скачанный csv-файл датасета.
После чего приступил к подготовке данных для гистограммы. Используя функцию sns.histplot я вывел данные о возрасте опрошенных студентов из столбца «Age».
Для начала я разделил данные по полу студентов. В df_male сохранил записи, где в столбце Gender указан мужской пол, используя условие df['Gender'] == 'Male'. То же самое сделал для женщин, сохранив данные в df_female, используя условие df['Gender'] == 'Female'. Так я получил два датафрейма: один для мужчин, другой для женщин.
Затем я создал график для мужчин. Используя sns.countplot, я построил столбчатую диаграмму для столбца Academic Pressure из датафрейма df_male. Аналогичную диаграмму я построил для женщин. Для этого использовал sns.countplot с данными из df_female
Для круговой диаграммы я определяю что столбец Depression в данных отображает наличие депрессии среди студентов, где 1 означает «Да» (есть депрессия), а 0 — «Нет» (депрессии нет). Далее я использую df['Depression'].value_counts (), чтобы подсчитать количество значений 1 и 0 в столбце Depression.
Это создает серию с двумя значениями: сколько студентов имеют депрессию, и сколько не имеют. С помощью plot.pie () я строю круговую диаграмму.
Для площадного графика, я рассчитывал среднее количество часов учебы для каждого уровня академического давления. Для этого использовал функцию sns.lineplot, которая строит линейную диаграмму. На оси X отображается Academic Pressure (уровень академического давления), на оси Y — Study Hours (среднее количество часов учебы).
Визуализация данных
Гистограмма. Распределение студентов по возрасту.
Из гистограммы видно, что большинство студентов находятся в возрастных группах 20-28 лет, и с возрастом количество студентов значительно снижается.
Круговая диаграмма. Распределение депрессии среди студентов.
Круговая диаграмма показывает, что среди студентов, участвующих в исследовании, практически равное количество тех, кто испытывает депрессию, и тех, кто не сталкивается с этим состоянием.
Диаграмма. Связь академической нагрузки с мыслями с депрессией.
График показывает, что с увеличением академического давления увеличивается и количество студентов, страдающих депрессией. Скорее всего высокий уровень академического давления оказывает сильное влияние на психоэмоциональное состояние студентов.
Виоловая диаграмма. Связь мыслей о суициде и финансовых проблем
Этот график показывает, что студенты с мыслями о суициде имеют более высокий и более широкий уровень финансового стресса по сравнению с теми, у кого нет таких мыслей. Это может указывать на более тяжелую нагрузку и стресс у студентов, переживающих такие психоэмоциональные трудности.
Линейно-площадный график. Связь количества часов на обучение и уровнем академического давления.
График показывает, что студенты с более высоким академическим давлением, вероятно, тратят больше времени на учебу, что может быть связано с повышенными требованиями и стрессом. Чем выше уровень академического давления, тем больше времени студенты, вероятно, посвящают учебным занятиям.
Описание применения генеративной модели
Для своей работы я использовал Chat-GPT версии 4o. Он помог мне кастомизировать цветовую палитру в диаграммах.
Посмотреть промпты: https://docs.google.com/document/d/1J9U8iWzlqvfajNinz7FMvG5-O7reyyaHq7xKlkd1Ya8/edit?usp=sharing
Ссылка на модель: https://openai.com/index/gpt-4/
Список источников