Original size 2480x3500

Анализ коллекции Метрополитен музея

PROTECT STATUS: not protected

Содержание

01 Обзор проекта Датасет и методология

02 Предобработка данных Пайплайн и преобразование

03 Визуальный анализ Отделы и временная шкала

04 Заключение и выводы

Глава 1.

Обзор проекта. Понимание масштаба и значимости анализа одной из крупнейших музейных коллекций в мире

Источник датасета и обоснование выбора

Открытый набор данных Метрополитенского музея, доступный на Kaggle, содержит исчерпывающую информацию о 408 636 объектах из коллекции музея. Этот набор данных был выбран потому, что коллекция МЕТ представляет собой одно из самых обширных и разнообразных культурных хранилищ в мире, что делает его идеальным для анализа исторических и культурных тенденций в разные периоды, по национальностям и художественным стилям.

Аналитический потенциал

В данном анализе изучаются временные тенденции для выявления закономерностей в коллекционировании произведений искусства, географическое распределение для понимания культурного представительства, состав отделов для определения кураторских приоритетов, а также типология объектов для изучения закономерностей сохранения и приобретения с течением времени.

Вопросы иследования

1 Как состав коллекции отражает институциональные приоритеты музея? 2 Какие временные закономерности наблюдаются в деятельности по приобретению и коллекционированию? 3 Какие культурные географические регионы представлены, и как это развивалось со временем? 4 Как различается временное распределение различных типов объектов?

Источник: https://www.kaggle.com/datasets/metmuseum/the-metropolitan-museum-of-art-open-access

Original size 1288x254

Аналитическая модель и стратегия визуализации

Гистограммы

Цель:

Сравнить распределение по категориям в различных департаментах и определить приоритеты учреждения.

Инсайт:

Раскрывает состав коллекций и относительное преобладание различных кураторских направлений.

Линейные графики

Цель:

Отслеживать временные тенденции при помощи скользящих средних, чтобы сгладить колебания и выявить скрытые паттерны.

Инсайт:

Определяет пиковые периоды пополнения коллекции и исторические закономерности приобретения ресурсов.

Тепловые карты

Цель:

Визуализировать взаимосвязи между категориями — например, выявлять закономерности распределения между национальностями и веками.

Инсайт:

Раскрывает культурную географию и временную концентрацию художников в коллекции.

Boxplots

Цель:

Анализировать распределения характеристик и выявлять выбросы среди объектов разных типов.

Инсайт:

Позволяет увидеть временные диапазоны и выявить особенности сохранения информации на различных носителях.

Визуальный стиль

Винтажная эстетика, вдохновленная институциональным наследием Метрополитенского музея и классическими музейными каталогами. Теплая, приглушенная цветовая палитра с шрифтами Playfair Display, EB Garamond и Libre Baskerville создает атмосферу научной элегантности.

Статистическая строгость

- Частотный анализ: подсчет значений для категориальных распределений

- Временная группировка: агрегирование по десятилетиям и столетиям.

- Сглаживание сигнала: скользящее среднее за 5 периодов для большей ясности тренда.

Original size 952x512

Глава 2.

Предварительная обработка данных. Критически важный этап: преобразование исходных данных коллекции в формат, готовый для аналитического анализа

Конвейер очистки и преобразования данных

Оценка качества данных

Первоначальная оценка качества данных выявила значительные проблемы, требующие всесторонней очистки и нормализации для обеспечения аналитической надежности.

Отсутствующие данные: ~30% Несовместимость: Категории

Технический стек

- Python: Основной язык программирования - pandas: Манипулирование и анализ данных - seaborn: Визуализация - matplotlib: Создание пользовательского графика

Операции по очистке данных

Нормализация полей данных

Проведен анализ строковых представлений дат, учтены соглашения до нашей эры и нашей эры, преобразованы в согласованный числовой формат. Удалены недопустимые даты и пропущенные значения обработаны путем стратегического исключения. Категориальная стандартизация

Внесены стандартные обозначения в названия отделов и полей, содержащие информацию о гражданстве, что позволило устранить несовместимости в системах наименования и географической классификации.

Создание производного столбца

Original size 1258x246

Стратегия фильтрации Top-k

Обоснование:

Применение частотной фильтрации позволило сфокусироваться на наиболее часто встречающихся значениях, улучшив наглядность визуализации и сохранив при этом аналитическую ценность.

Топ: 10 Покрытие: ~75%

Data Standardization

Временная и категориальная нормализация

Ключевые решения

- Исключить объекты с отсутствующими датами - Нормализовать конвенции до нашей эры/до н. э. - Стандартизировать категориальные метки - Применить фильтрацию по топ-k

Стандартизация временных данных

Данный набор данных охватывает более 2500 лет, что требует тщательной нормализации правил датирования для обеспечения осмысленного временного анализа.

- Диапазон дат: 500 г. до н.э - До: 2016 г. н.э - Промежуток: 2,516 лет - Работа с конвенциями до н. э./н.э.

Даты до нашей эры были преобразованы в отрицательные целые числа, а даты нашей эры — в положительные целые числа, что позволило создать непрерывную временную шкалу для математических операций.

Категориальная нормализация

Устранены несоответствия в категориальных полях для обеспечения точной группировки и анализа.

- Поле национальности: Стандартизированные названия стран, устранение расхождений и объединение географических регионов для более наглядного анализа.

- Классификация отделов: Стандартизированы названия отделов для обеспечения единообразной классификации во всей коллекции.

Многозарешающий временной анализ

- Годовой уровень: Точность по каждому году для детального анализа

- Сводные данные по десятилетиям: 10-летние периоды для выявления трендов

- Вековые виды: 100-летние периоды для долгосрочных закономерностей

Влияние на анализ

Эти решения обеспечили качество данных, сохранив при этом более 70% исходного набора данных.

Глава 3.

Визуальный анализ. Выявление закономерностей и историй, скрытых в данных музейной коллекции

Топ-10 отделов по размеру коллекции

Original size 1990x1086
  1. Доминирование произведений на бумаге

Раздел «Рисунки и гравюры» составляет 37,8% всей коллекции (154 513 объектов), что отражает как кураторскую направленность музея, так и историческую распространённость графических видов искусства.

  1. Географическое и культурное представительство

Разделы Азиатское искусство (47 406 объектов) и Американское декоративное искусство (17 783 объекта) демонстрируют приверженность музея культурному разнообразию.

  1. Престиж европейской живописи

Выставка «Европейские картины» (20 644 экземпляра) представляет собой собрание ценных, канонических произведений, подчеркивающее роль музея в сохранении западных художественных традиций.

Такое распределение отражает эволюцию Метрополитен-музея: от учреждения XIX века, сосредоточенного на западном искусстве, до глобального энциклопедического музея.

Рост коллекции с течением времени

Original size 1612x890

- Пик 1900-х годов

Наибольший рост коллекции наблюдается в 1900-х годах, что совпадает с золотым веком пополнения фонда музея, обусловленным благотворительностью и археологическими экспедициями.

- Анализ скользящего среднего

Пятипериодное скользящее среднее сглаживает волатильность от года к году, выявляя основные тенденции в моделях приобретения активов.

- Институциональный контекст

Музей был основан в 1870 году, и последующий рост отражает его стремительное превращение в учреждение мирового класса

- Статистический метод

Скользящее среднее за 5 периодов. Сглаживает краткосрочные колебания, позволяя выявить долгосрочные тенденции в моделях приобретения активов.

Национальности художников на протяжении веков

Original size 1538x884

- Доминирование американских художников в современную эпоху

Американские художники доминируют в период с XVIII по XX века, что отражает первоначальную миссию музея по сохранению культурного наследия США.

- Историческая глубина европейского искусства

Французские, итальянские, британские и немецкие художники имеют значительное представительство на протяжении нескольких столетий, что подчёркивает историческую роль Европы как центра художественного производства.

- Межкультурный обмен

Разнообразие национальностей художников в коллекции демонстрирует активный межкультурный обмен и глобальный характер формирования собрания музея.

Распределение дат создания по типам объектов

Original size 1754x950

- Гравюры: самый широкий временной диапазон

Гравюры демонстрируют наиболее широкий временной диапазон, что отражает долговечность и историческую преемственность техник печатной графики.

- Рисунки: историческая концентрация

Рисунки преимущественно сосредоточены в более поздних столетиях, что указывает как на смещение, связанное с сохранностью, так и на возрастание роли рисунка как самостоятельного вида искусства.

- Статистические выводы на основе boxplot

Диаграммы размаха (boxplot) позволяют определить медианные годы создания, квартильные значения и выбросы, обеспечивая комплексное представление о временных закономерностях.

- Статистический метод Метод: анализ с использованием диаграмм размаха (boxplot) Назначение: выявление характеристик распределения, выбросов и сравнительных паттернов между различными типами объектов

Глава 4.

Выводы и Заключение

Стратегические выводы и профиль сбора данных

- В основном представлены работы на бумаге.

Рисунки и гравюры составляют 37,8% коллекции, что отражает историческую направленность музея на графическое искусство, а также относительное обилие и преимущества сохранности работ на бумаге.

- Пик коллекционирования в 1900-х годах.

Десятилетие 1900-х годов представляет собой пик роста коллекций, совпадающий с институциональным зрелостью музея и золотым веком развития американских музеев.

- Американская идентичность в современную эпоху.

Американская национальность доминирует в экспозициях XVIII–XX веков, отражая культурную миссию музея и подъём американского искусства на мировой арене.

-Европейская историческая глубина.

Европейские художники демонстрируют поразительную временную глубину: французские, итальянские и британские мастера представлены в разных столетиях.

Институциональные последствия

- Стратегия сбора

Стратегический акцент на работах, представленных на бумаге, позволил расширить масштабы приобретения.

- Культурное представительство

Баланс между американской идентичностью и мировым культурным наследием.

- Историческое наследие

Пик коллекционирования в 1900-х годах определил траекторию развития этого учреждения.

Original size 970x306

Статистическая проверка и строгость

- Частотный анализ

Функция value_counts () была применена для количественной оценки распределения категори значений, что обеспечило точное ранжирование отделов, национальностей и типов объектов.

- Временная группировка

Внедрены агрегированные данные по десятилетиям и столетиям для обеспечения многоуровневого временного анализа, позволяющего выявлять как краткосрочные колебания, так и долгосрочные тенденции.

- Сглаживание сигнала

Применили пятипериодное скользящее среднее к временным данным, что позволило снизить уровень шума и выявить основные тенденции в закономерностях роста коллекции.

- Анализ распределения

Для анализа характеристик распределения, выявления выбросов и сравнения временных диапазонов для различных типов объектов использовалась визуализация в виде диаграмм размаха.

Обеспечение аналитической надежности

Каждый статистический метод был выбран для решения конкретных аналитических задач и обеспечения надежности и интерпретируемости результатов.

- Обеспечение качества данных: Благодаря комплексной очистке удалось сохранить более 70% набора данных.

- Временная нормализация: Стандартизированные правила датирования на протяжении 2500 лет.

- Категориальная стандартизация: Устранены несоответствия в наименованиях национальностей.

- Стратегия фильтрации: Подход Top-k обеспечил баланс между ясностью и полнотой.

Original size 950x226

Данный анализ коллекции Музея Метрополитен раскрывает исключительный масштаб и стратегическую направленность этого учреждения. На основе 408 636 объектов, охватывающих более 2 500 лет истории, были выявлены закономерности, которые проливают свет как на кураторские приоритеты музея, так и на более широкие культурные тенденции. Преобладание произведений на бумаге, пик пополнения коллекции в 1900-е годы, а также географическое разнообразие художников формируют целостное повествование о культурном наследии и институциональном развитии. Винтажный визуальный стиль, использованный в данном анализе, отдает дань историческому наследию музея и одновременно применяет современные аналитические методы, позволяя раскрыть вечные истории, скрытые в одной из величайших культурных сокровищниц человечества.

Источники

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more