Original size 1140x1600

Обучение генеративной модели Stable Diffusion под стиль Mystic Messenger

PROTECT STATUS: not protected
12

Цель проекта

В игре Mystic Messenger много иллюстраций, имитирующий съемку с камеры телефона. Все они вертикальные, на них нередко встречаются лица персонажей и их быт. Я хочу обучить модель создавать такие же изображения, и для этого я собрала датасет из 106 фотографий.

Mystic Messenger — игра в жанре отомэ (визуальная новелла или симулятор свиданий) для смартфонов и планшетов, выпущенная корейской компанией Cheritz в 2016 году.

Обучение

Модель обучалась с помощью Stable Diffusion XL (SDXL), DreamBooth и LoRA. Обучение шло с шагов 400 и заняло 38 минут.

Без учета времени сбора изображений, так как они были взяты из собственной библиотеки и преобразованы под формат 512 на 512 в дальнейшем.

big
Original size 900x827
0

Несколько примеров из библиотеки.

Описание применения генеративной модели

LORA: mysmes_LoRA prompt: mystic messenger artstyle

Сам процесс заключался в переписи всех изменяемых моментов в коде, для лучшего освоения материала и удобного использования.

Далее происходило созданием токена через Hugging Face, его настройка и вставка в код.

В том числе большое количество времени отняло загрузка всех этапов Setup и настройка\обучение Stable Diffusion XL (SDXL) в Google Colab.

Original size 641x359

Названия и импорт изображений.

Original size 1046x497

Импорт моделей.

Original size 1791x720

Первая генерация.

Первая проба генерация оказалась весьма неудачной, все же оригиналы имеют относительно нормальные черты лица с легкой формой стилизации.

Думаю поэтому и присутствует «несуразность» на первых этапах генерации.

1. mystic messenger artstyle, portrait of a happy blonde-haired woman, black background (первая попытка) 2. mystic messenger artstyle, portrait of a white-haired man, lokking in the camera

Итоговые генерации

Несколько генераций спустя картины стали лучше и качественнее отражали стиль новеллы.

Original size 1024x1024

mystic messenger artstyle, photo of a street in japan

1. mystic messenger artstyle, a cup on the empty wooden desk 2. mystic messenger artstyle, a dark-haired woman looking in the sky (1)

0

1. mystic messenger artstyle, a photo of a table with dinner, candle and a rose 2. mystic messenger artstyle, a red-haired waiteress in the cafe holding menu 3. mystic messenger artstyle, a waiteress in the cafe in front of a bar 4. mystic messenger artstyle, barista in the cafe

1. mystic messenger artstyle, black-haired man with flowers in his arms 2. mystic messenger artstyle, city seoul photo

1. mystic messenger artstyle, many flowers in a man’s hand, photo made by phone 2. mystic messenger artstyle, painting portrait of a beautiful woman

Original size 1024x1024

mystic messenger artstyle, yummy breakfast with eggs and sausage

Итог

В конце концов, я довольна результатом, он оказался более чем достойным и возможным для дальнейшей реализации собственных сюжетов в генерируемых иллюстрациях.

Модель все еще надо обучать для более чистого итога, но начало положено и оно выглядит отлично!

Обучение генеративной модели Stable Diffusion под стиль Mystic Messenger
12
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more