Original size 1140x1600

Обучение генеративной модели на лабрадорах

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

В рамках проекта мною были исследованы возможности генеративной модели применительно к созданию изображений лабрадоров. Интерес к данной породе собак послужил основанием для обращения к теме виртуального синтезированного образа.

В качестве исходного материала использовались предварительно отформатированные фотографии, репрезентирующие широкий спектр изображений лабрадора-ретривера, что позволило повысить качество генерируемых моделью результатов.

Референсы –– Исходные изображения

big
Original size 1657x750
0
big
Original size 1657x750

Сгенерированные изображения

Original size 1657x750
0

В ходе работы генеративная модель продемонстрировала ожидаемую эффективность, позволив синтезировать ряд изображений. Тем не менее, в процессе генерации были выявлены два аспекта, которые не удалось полностью контролировать:

  1. Влияние отдельных референсных изображений приводит к тому, что модель с определенной периодичностью воспроизводит ретриверов с нарушенными пропорциями головы.

  2. На отдельных сгенерированных изображениях наблюдается эффект некорректного добавления или редукции конечностей.

Original size 1657x750

Таким образом, можно сказать, что генеративная модель смогла хорошо уловить объект и поместить его в разные сцены, обеспечив минимальные потери в детализации и соблюдении пропорций.

Original size 1657x750

Процесс обучение генеративной модели

Обучение генеративной модели проходило в Google Collab. Процесс включал несколько этапов.

Сначала загружался подготовленный набор изображений, все фотографии были приведены к единому формату и размеру. Затем для них автоматически создавались текстовые описания с помощью модели BLIP.

После этого выполнялось обучение модели с использованием метода LoRA на базе архитектуры SDXL, а затем осуществлялась генерация изображений в заданном стиле. Для вычислений применялся графический процессор (GPU), что позволило ускорить работу.

Описание применения генеративной модели

Для улучшения генеративных функций я обращалась к модели DeepSeek, которая помогла мне подправить код промта и сделать генерации более реалистичными и минимализировать потерю детализации.

Обучение генеративной модели на лабрадорах
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more