Original size 576x789

Кто был до Юры Борисова?

PROTECT STATUS: not protected

Вводная часть

Недавний всплеск интереса к «Оскару», благодаря первой в 21 веке номинации русского актера на эту награду — Юры Борисова — невозможно было не заметить. А фильм, за который Юра и попал в список номинантов, «Анора», и вовсе получил в итоге 5 наград в номинациях. Это, в свою очередь, породило массу споров о разнице в системе оценивания фильмов кинокритиками и обычными зрителями. Поскольку последние считали других номинантов более достойными, а саму «Анору» переоценённой экспертами.

Original size 3238x2160

Юра Борисов, Шон Бейкер, Майки Мэдисон, Карен Карагулян и Ваче Товмасян на Кинофестивале в Торонто // 2024 год // Frank Sun

Мне, как любителю кино, стало интересно узнать больше про самую престижную награду в мире кино и про ее, почти столетнюю, историю. Какой же жанр лучше снимать, чтобы с наибольшим шансом быть номинированным? А также интересно — насколько разнятся оценки внутри этих жанров от зрителей и от кинокритиков.

Я решил проанализировать датасет о фильмах. Для этого я нашел на Kaggle два набора данных: один о фильмах, другой — о номинантах на «Оскар». Поскольку в первом не было информации о наградах, а кинопремия меня интересует, я объединил их в один датасет. Было любопытно изучить различные тренды и статистику, особенно учитывая внушительный объем данных — около 40 тысяч строк.

Я постарался вместить на каждый график максимальное количество информации. Для этого были использованы тепловая карта, двойные, сложенные столбчатые и круговые диаграммы.

Этапы работы

Для начала мне нужно было объединить два .csv файла в один расширенный датасет. Я привел все названия фильмов к единому формату (все буквы в нижнем регистре) и добавил в датафрейм с фильмами два новых столбца. В столбце oscars содержится значение 1 — если фильм был номинирован, 2 — если выиграл, и 0 — если не получил номинацию. В столбце category указаны категории, на которые был номинирован фильм.

Позже я заметил, что в датасете слишком много жанров. Некоторые из них мне не подходили, например, анимация, короткометражки и записи концертов стендап-комиков. Также я удалил редкие жанры, которые мешали восприимчивости графиков, такие как спорт, гангстеры, эротика и экспериментальное кино.

Original size 939x504

Старт

С некоторыми более сложными графиками возникали проблемы, и я обращался к Deepseek за помощью с кодом. Также я поручил ему такие рутинные задачи, как выписывание оттенков в палитре matplotlib в диапазоне от желтого до красного.

Я решил оформить графики в цветах, которые ассоциируются с «Оскаром» и Голливудом — желтый и красный, как золотая статуэтка и красный ковер. Мне показалось, что эти цвета лучше смотрятся на черном фоне, и я также заменил шрифт на более изысканный.

Роберт Дауни-младший и Киран Калкин (левое фото), Скарлетт Йоханссон (правое фото) на фоне фирменных, для «Оскара», цветов // 2025 // Майк Коппола

Итоговые графики

Original size 1022x644
Original size 1608x918

При сравнении оценок меня удивило, что средние оценки критиков и зрителей оказались так близки — практически одинаковыми, с максимальной разницей в 0,3. В любом случае, на этом графике интересно проследить, какие жанры оцениваются выше — и, как оказалось, это в основном более «серьезные» жанры: нуар, документальные и военные фильмы.

Original size 1248x606
Original size 944x965

После этого я захотел увидеть, как зрители оценивают фильмы, и создал этот график. Можно заметить, как мало оценок 1-2 и 9-10, но это вполне логично. Очень плохой фильм, как и очень хороший, сложно снять. А чуть больше половины всех фильмов были оценены на 6 или 7 из 10.

Original size 946x623
Original size 1486x921

Затем я рассортировал фильмы по декадам, так как хотел исследовать исторические тренды. По графику видно, что драмы и комедии всегда доминировали, но также можно сделать более тонкие наблюдения. Вестерн быстро поднялся на вершину, но так же стремительно упал в конце 70-х. Приключенческие и шпионские фильмы в 60-е были довольно популярны, однако сейчас у них сильный спад. Мьюзиклы давно вышли из моды, но сейчас находятся на небольшом подъеме.

Original size 1035x909
Original size 1188x590

И, наконец, я использовал данные об «Оскарах». Интересно, как стремительно увеличивалось и продолжало расти количество номинантов. Легко выделить любимые жанры академии: это конечно же, драма, а также комедии и триллеры.

0
Original size 790x405

Еще я обнаружил, что можно составить облако слов, и в датасете как раз были колонки с описаниями фильмов и заметками. Результат получился интересным — отчетливо выделяется тема человеческих отношений, а также глаголы, такие как begin, decide, find, work.

Original size 1352x900

Леонардо Ди Каприо с «Оскаром» // 2016 год // Анджела Вайс

Итоги

Как оказалось, оценки критиков и зрителей чаще всего практически идентичны. Если критикам свойственно обращать внимание на художественную ценность, качество и оригинальность сюжета. То для зрителя важнее эмоциональный отклик, благодаря которому он может спокойно «закрыть глаза» на всю вторичность. Однако действительно высококлассное кино сочетает и качество и эмоции, делая разницу в оценках двух «лагерей» минимальной.

Самими доминантными жанрами, по сумме аспектов, стали драма и комедия. Их номинируют чаще остальных, снимают и смотрят чаще остальных, а оценки для этих жанров являются одними из лучших. Так что, если хотите быть номинированным на «Оскар», все просто — снимайте драму или снимайтесь в ней.

Использование генеративного ИИ

Deepseek — дебаг кода, разбор ошибок, выписывание оттенков в палитре.

Кто был до Юры Борисова?
Project created at 02.04.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more