Original size 2480x3500

Обучение генеративной нейросети под стиль Михаила Врубеля

PROTECT STATUS: not protected
2

Описание проекта

Основная тема проекта — обучение генеративной модели Stable Diffusion с LoRA-тюнингом для достижения генерации изображений, стилистически соответствующих живописным работам Михаила Врубеля. Задача состоит в том, чтобы нейросеть учла особенности цветовой палитры, композиции, изображения людей и природы, атмосферу работ и даже то, как художник наносил мазки.

Мною был собран датасет из различных работ художника, включающих не только его самые известные произведения и сюжеты, но и те, которые помогают выделить особенность его полотен. Поскольку живопись Врубеля во многом отличается от работ других художников именно настроением и атмосферой было важно, чтобы это было учтено.

Исходные изображения для обучения

0
0

Описание процесса обучения

Сначала мы подключаем видеокарту, для чего используем Google Collab, а не свой компьютер, что ускоряет обучение нейросети. А также устанавливаем и скачиваем библиотеки.

Original size 1905x647

Затем создается папка, и загружаются файлы оригинальных картин Врубеля с компьютера.

Original size 1707x773

Далее подключаем библиотеки и строим сетку, на каждую ячейку которой мы ставим изображение — делаем коллаж.

Original size 1847x901

Затем на основании имеющейся модели будет происходить процесс обучения.

Также в приведенном ниже блоке мы описываем исходные изображения. Для этого используется модель image to text, чтобы не описывать каждое изображение вручную и ускорить процесс. Модель описала достаточно конкретно, но возможно не так красочно и подробно, как мог бы человек. Однако меня устроил полученный результат.

Original size 2115x468
Original size 2083x1049

Далее происходит логин на Hugging Face. Делается своя директория и туда загружается результат работы.

Original size 1315x125

Следующий блок запускает процесс обучения.

Original size 1468x852

Затем происходит генерация картинки по описанию с учетом обученной модели.

Original size 2220x951

Результирующая серия изображений

В итоге полученные изображения можно условно разделить на три раздела — работы, где изображены демоны, пейзажи и портреты.

Получившаяся модель хорошо генерирует изображения, связанные с демонами, и поскольку у Врубеля это отдельная серия работ, здесь они тоже образуют свою категорию.

Original size 3300x1950

promt: winged demon with shadowy form perched on ancient ruins at dawn, with the first rays of sun creating a golden halo effect

В приведенной работе достаточно точно стилистически передан фон и то, как изображен сам демон, который своими чертами напоминает оригинальную скульптуру демона, выполненную самим Врубелем.

promt: demon with shadowy wings in mid-flight against a bright, stormy sky, his wings spread wide, with lightning striking in the background / horned demon with leathery wings kneeling in a field of white flowers under a bright, full moon, creating stark contrast

Интересно рассмотреть различные пейзажи в стиле Врубеля, поскольку хорошо видно как нейросеть переносит стиль мазков художника и показывает даже непривычные для Врубеля сюжеты, в которых он все равно узнается.

Original size 3300x1950

promt: lone, gnarled tree on a windswept hill, its branches silhouetted against a dramatic, stormy sky

Здесь правильно передано именно настроение работ художника, обладающих некой мрачностью и драматизмом, а также художественные приемы и цветовая гамма.

promt: empty beach at low tide with patterns in wet sand and distant seagulls / lavender fields in Provence at sunset, with rows of purple flowers creating patterns across the rolling hills

Стиль художника считывается в приемах и в том, как «наложены» краски.

promt: hidden cave behind a thundering waterfall, with sunlight filtering through the curtain of water, revealing moss-covered rocks / placid, meandering river at twilight, with fireflies blinking among the reeds and willow trees on its banks

Стиль Врубеля хорошо узнается именно в работах, где присутствуют люди, поскольку художник изображает их определенным образом, а в особенности глаза, и у нейросети получается это передавать.

Original size 3300x1950

promt: woman with a serene expression, sitting on a stone bench in a sun-dappled, overgrown monastery courtyard

promt: traveler with a worn backpack and a determined gaze, resting at a crossroads under a gnarled, ancient tree / scientist intently studying a complex molecular model in a lab cluttered with beakers and scribbled-on whiteboards

promt: blacksmith pausing for a moment, wiping sweat from his brow in a forge filled with glowing embers and scattered tools / elderly fisherman mending his nets on a weathered dock, his face etched with deep wrinkles from a lifetime at sea

Комментарий

Можно выделить стилистические особенности, которым следует нейросеть: — Драматизм, свойственный художнику. Он особенно хорошо считывается в серии про демонов, но при этом виден даже пейзажах, которые по идее должны быть умиротворяющими (например, изображение нейросети с пляжем) — Визуально отделенные друг от друга мазки, переходы цветов не слишком плавные. — Хаотичность мазков, из-за чего объекты как бы растворяются друг в друге — Цветовая палитра соответствующая стилю художника

Original size 3300x1950

promt: canyon with towering, layered rock walls in shades of red and orange, carved by a thin, green river

Присутствует некая хаотичность и отчетливое разделение мазков. Также мазки находящиеся рядом отличаются по оттенку, но все равно сочетаются вместе.

promt: rugged, volcanic landscape with sharp black rocks and steam rising from fissures in the earth / tropical jungle with enormous blooming hibiscus flowers and orchids, with mist rising

Здесь и в вулканическом пейзаже с горой, и в работе с цветами считывается особое настроение, которое указывает нам на художника. Мы осознаем, что смотрим не романтические или спокойные пейзажи. Чувствуется напряженность, передаваемая и через цветовую палитру, и через композицию.

Original size 3300x1950

promt: young child peeking out from behind a heavy velvet curtain in a grand, but dusty and forgotten, ballroom

В данной работе хочется отметить бездонность глаз ребенка и особый взгляд всех людей, изображаемых художников, который нейросети удалось достаточно удачно отразить.

Original size 3300x1950

promt: lily pads and blooming water lilies covering a calm pond, with weeping willow branches touching the water’s surface

Нетипичный для Михаила Врубеля сюжет лилий, в котором несмотря на некоторую лиричность и светлою цветовую гамму, угадывается стиль художника.

Итог

Исходя из всего вышесказанного, можно сделать вывод, что нейросеть была успешно обучена под стиль выбранного художника. Обученная модель воспроизводит черты художника в самых различных сценариях, даже не свойственных его живописи, например в пейзажах или спокойных цветочных композициях. Мы можем проследить схожести в цветовой палитре, настроении, композиции, виде мазков.

Подобным образом можно обучить модели другим художникам, а также соединять стили различных художников между собой, создавая интересные комбинации.

Original size 3300x1950
Обучение генеративной нейросети под стиль Михаила Врубеля
2
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more