
Цель проекта — обучить нейросеть создавать изображения в духе импрессионизма, используя работы Клода Моне (1840–1926) как визуальную основу.
Проект исследует, как нейросеть может перенять характерные особенности стиля Моне: Живописную технику мазка Игру света и атмосферу Цветовую палитру импрессионизма Применение стиля к современным сюжетам
Основная гипотеза: Импрессионизм изменил представление о живописи — вместо точной передачи формы он сосредоточился на мгновении, свете и ощущении атмосферы.
Задача: Обучить нейросеть «видеть» как Моне Передать художественные принципы импрессионизма Создать новые работы в этом стиле
Датасет
Параметры сбора данных: Количество изображений: 60 работ Моне Разрешение: высокое качество Формат: PNG Права: общественное достояние Источники: The Metropolitan Museum of Art https://www.metmuseum.org/art/collection (CC0) Rijksmuseum Collection https://www.rijksmuseum.nl/en/search Art Institute of Chicago https://www.artic.edu/collection Wikimedia Commons https://commons.wikimedia.org/wiki/Claude_Monet
Обучение модели
Архитектура модели: Stable Diffusion (дообучение / DreamBooth)
Цели обучения: Передача характерных мазков Сохранение цветовой палитры Воспроизведение световых эффектов Генерация новых сюжетов в стиле Моне
Далее: подготовка (загрузка и подключение библиотек) и просмотр датасета
image_grid (imgs[: 10], 1, num_imgs_to_preview)
image_grid (imgs[10:20], 1, num_imgs_to_preview)
image_grid (imgs[20:30], 1, num_imgs_to_preview)
image_grid (imgs[30:40], 1, num_imgs_to_preview)
Затем, я… …создала подписи к работам Моне, …создала JSON файла с префиксами, …подготовила и вошла на Hugging Face, … и приступила к обучению.
Настройка параметров обучения
Для обеспечения эффективного и стабильного обучения модели DreamBooth с использованием LoRA в требовательных к ресурсам конвейерах, таких как Stable Diffusion XL, применяются следующие методы оптимизации: Аккумуляция градиентов (--gradient_accumulation_steps) 8-битная оптимизация Adam (--use_8bit_adam) Вычисления с пониженной точностью (--mixed-precision="fp16») Оптимизация процесса обучения: Аккумуляция градиентов — позволяет эффективно увеличивать размер батча без превышения лимитов памяти 8-битная оптимизация — значительно сокращает потребление памяти без существенной потери качества Смешанная точность — ускоряет вычисления за счет использования формата FP16 для большинства операций
Демонстрация работы обученной модели
prompt = «photo collage in MONE style, Two people in a canoe on a fast-flowing river, surrounded by a mountainous landscape, a bright sunny day, and water sparkling with reflections of the sky and tre
Анализ результатов
Сходство с стилем Клода Моне:
Цветовая палитра: Генератор успешно перенял характерную для Моне палитру с преобладанием мягких, пастельных тонов, а также ярких акцентов в изображении воды и света. Техника мазка: Модель научилась имитировать характерные мазки кисти, создающие эффект движения и легкости, что является отличительной чертой импрессионизма. Свет и атмосфера: Изображения передают игру света и тени, создавая ту самую «атмосферность», которая присуща работам Моне. Визуальный анализ мазков и текстур
При детальном рассмотрении сгенерированных изображений мы наблюдаем: Характерные для Моне короткие и быстрые мазки. Правильную передачу света и тени за счет контрастных мазков. Типичное для импрессионизма отсутствие четких контуров, формы создаются за счет цветовых пятен. Выводы по результатам
Стилистическое сходство: Модель успешно научилась генерировать изображения, которые визуально очень близки к работам Клода Моне. Цвет и свет: Передача цветовой палитры и световых эффектов соответствует импрессионистскому стилю. Техника мазка: Модель имитирует технику мазка, что подтверждает успешное усвоение стиля. Заключение: Наша модель демонстрирует высокую способность к переносу стиля Клода Моне на новые изображения. Это открывает возможности для создания цифрового искусства в стиле импрессионизма.