
Концепция
В учебных и образовательных системах успех студентов зависит от множества факторов. В рамках проекта будет проанализировано, как эти параметры влияют на учебные достижения студентов.

ОБРАБОТКА ДАННЫХ

Для загрузки датасета использовался pandas, чтобы показать графики основанные на данных использовалась библиотека matplotlib и для красоты — seaborn.
Были преобразованы имена колонок и некоторые другие изменения. Например, пробелы заменяются на подчеркивания (_), а скобки удаляются. Преобразованы значения в колонке «Age» в числовой формат, то же самое для колонки «Quiz_Scores». Преобразованы данные о времени, затраченном на видео, в числовой формат, как и данные о проценте завершения заданий.
ВИЗУАЛИЗАЦИЯ ДАННЫХ
Здесь отображено как распределено количество студентов по возрасту. Есть определённые провалы по студентам в следующих возрастах: 20, 25, 30, 37, 43. Вероятно, это некоторые пики при которых студенты меньше заинтересованы в образовании.
На втором графике можно выделить, что между полами нет особой разницы в контексте оценок на квизах.
На гистограмме «Влияние уровня образования на завершение заданий» выделяется тот факт, что процент выполнения заданий не меняется от уровня образования.
Здесь же можно сказать, что самые частые участники первые курсы на кибербезопасности, а на втором курсе нигде не является самым частым участником, в то время как третий курс является самым частым участником на основах python, а четвёртый курс чаще всех участвуют на квизах на остальных курсах. Что говорит об большом кругозоре на 4 курсе и относительном малом желании на 2 курсе.
На пятом графике нельзя выделить, что пол каким-либо образом влияет на успешность выполнение заданий от потраченного времени, что говорит о том, что в действительно для всех всё индивидуально.
СПИСОК ИСТОЧНИКОВ
[1] Kaggle — сайт соревнований для специалистов по Data Science: https://www.kaggle.com/datasets/adilshamim8/personalized-learning-and-adaptive-education-dataset Просмотрено: 20.03.2025.
БЛОКНОТ С КОДОМ И ДАТАСЕТ
Ссылка: ссылка на google disk, где лежат файлы с расширениями csv и ipynb
https://drive.google.com/drive/folders/1BWMnOk0w4kFk3u2COZVz6XqUVw2nP21o?usp=sharing