Original size 1140x1600

Упоминания ключевых фигур французской теории второй половины XX века.

PROTECT STATUS: not protected
The project is taking part in the competition

Выбор темы

Динамика упоминаний ключевых фигур французской теории второй половины XX века в англоязычном книжном корпусе.

В исследовании анализируется, как менялась частота и структура упоминаний следующих авторов:

— Ролан Барт — Жак Лакан — Луи Альтюссер — Мишель Фуко — Жак Деррида — Жиль Делёз

Направления и авторов я выбрала потому, что последнее время они часто мне встречаются, и мне было интересно посмотреть на статистику упоминаний, связанную с ними. В общем личные предпочтения.

В исследовании я формально делю авторов на структуралистов и постструктуралистов, но это используется как аналитическая рамка. Деление носит условный характер и отражает не всю интеллектуальную биографию авторов, а доминирующие теоретические позиции, с которыми они ассоциируются в англоязычном академическом дискурсе (а данные я беру именно такие).

big
Original size 2222x728

Данные

В качестве источника данных использован Google Books Ngram Viewer (English corpus, версия 2019). Из него были программно выгружены временные ряды относительной частоты упоминаний фамилий авторов в англоязычных книгах за период 1945–2019 гг.

Каждое значение представляет собой относительную частоту (долю упоминаний в общем объёме корпуса за конкретный год). Ресурс найден мной до курса и показался интересным, поэтому для своей задачи взяла именно его.

Для анализа были использованы разные типы визуализаций, каждый из которых отвечает на свой исследовательский вопрос:

— линейный график: динамика авторов во времени — столбчатая диаграмма: общий объём дискурса по годам — круговая диаграмма: вклад авторов за весь период — 100% «stacked bar»: структура внимания внутри каждого года — столбчатая диаграмма: актуальный срез последних лет

Этапы работы и обработка данных

1. Подготовка данных

Данные были выгружены из Google Ngram Viewer через JSON-интерфейс. Таблица приведена к «tidy»-формату (одна строка — один автор, один год). Числовые значения приведены к формату float. Для снижения годового шума применено скользящее среднее с окном 5 лет.

2. Используемые статистические методы

Агрегирование (суммирование по авторам и по годам), нормализация (приведение к процентам внутри года), скользящее среднее (rolling mean), сравнение распределений.

Касательно кода: анализ и обработка данных выполнены с использованием библиотеки Pandas. Для построения визуализаций использовалась библиотека matplotlib, являющаяся стандартным графическим backend Pandas и работающая с данными, подготовленными в табличном формате. Я прикрепляю некоторые этапы, но кода много, целиком можно ознакомиться по ссылке внизу.

3. Использование нейросетей

Нейросети использовались для отладки некоторых частей кода (4 график, логика экспортов) и дополнительного консультирования по работе синтаксиса и возможностей языка.

Все аналитические решения (выбор метрик, интерпретация графиков) принимались вручную. Код (за исключением некоторых указанных выше частей и решения общих вопросов) писался самостоятельно.

4. Стилизация графиков

Графики были стилизованы программно: задана собственная цветовая палитра, использован единый фон, отключены лишние рамки. Стилизация выполнялась исключительно через код.

Холодные оттенки — данные по структуралистам, тёплые — по постструктуралистам. Деление, ещё раз, условное. Палитра выбрана в нейтральных пастельных тонах.

Original size 2222x728

1. Упоминания авторов по годам

Original size 1428x707

График 1

Original size 2051x451

2. Объём упоминаний выбранного набора авторов в каждом году

Original size 1427x707

График 2

Original size 2092x705

3. Доля упоминаний по авторам за весь период

Original size 1037x1067

График 3

Original size 2086x740

4. Распределение внимания между авторами внутри каждого года

Original size 1426x1187

График 4

Original size 2112x762

Актуальный график внимания к авторам в текстах (среднее за последние 5 лет)

Original size 1428x707

График 5

Original size 1992x482

Заключение

Анализ показал, что интерес к французской теории второй половины XX века в англоязычном книжном корпусе меняется со временем и распределяется между авторами неравномерно. Разные типы графиков позволяют увидеть как индивидуальные траектории отдельных фигур, так и общую структуру внимания внутри теоретического поля: периоды роста и спада, смену фокуса и перераспределение значимости между авторами.

Фуко, как оказалось, стабильно последние 30 лет держит планку среди количества упоминаний. Еще показалось занимательным, что в 2010х годах весь корпус упоминаний резко увеличился. Нашла информацию, что это может быть связанно с канонизацией французской теории, её активным использованием в междисциплинарных исследованиях и эффектом массовой оцифровки академических публикаций, что увеличивает видимость цитирований в корпусе Google Books.Фуко, как оказалось, стабильно последние 30 лет держит планку среди количества упоминаний. Еще показалось занимательным, что в 2010х годах весь корпус упоминаний резко увеличился. Нашла информацию, что это может быть связанно с канонизацией французской теории, её активным использованием в междисциплинарных исследованиях и эффектом массовой оцифровки академических публикаций, что увеличивает видимость цитирований в корпусе Google Books.

Original size 2222x728

google doc с кодом: https://drive.google.com/drive/folders/1-kBeTEch48QzSSlstFbqk1svYBK7Dzty

ngrams, откуда брала данные: https://books.google.com/ngrams/

используемая языковая модель: gpt-5.2, https://chat.openai.com/ (части работы сделанные с помощью ИИ указаны выше)

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more