Original size 1140x1600

Обучение генеративной модели Stable Diffusion под стиль Ганса Гигера

PROTECT STATUS: not protected

Гигер Рудольф Гигер (1940–2014) — швейцарский художник, известный своими картинами в жанре фантастического реализма, в которых сочетаются биологические и механические элементы. Моя цель — дообучить нейросеть, чтобы она могла генерировать изображения, вдохновленные его стилем.

Для этого я собрала датасет из 17 изображений работ Гигера. Эти изображения станут основой для дообучения модели Stable Diffusion.

Особенностью техники Ганса Гигера было использование аэрографа, позволяющего создавать тонкие и детализированные изображения.

big
Original size 1280x938

Ганс Гигер / Решетчатая структура / 1983

Художник работал без предварительных набросков, начиная с верхнего левого угла и постепенно продвигаясь к правому нижнему. Этот метод позволял ему достигать высокой концентрации и полного погружения в процесс. В поздний период своей карьеры Гигер перестал использовать аэрограф и редко демонстрировал свою технику.

Моя цель — обучить нейросеть воссоздавать характерные черты работ Гигера, такие как высокая детализация, гармоничное сочетание биологических и механических элементов, а также использование специфической цветовой гаммы.

Примеры исходных изображений для обучения

big
Original size 1182x861

Ганс Гигер / Биомеханический пейзаж / 1984

Original size 1181x850

Ганс Гигер / Биомеханический пейзаж / 1977

Original size 1177x884

Ганс Гигер / Нью-Йорк / 1980

Original size 1200x875

Ганс Гигер / Нью-Йорк — Метро / 1981

Процесс обучения

Обучение генеративной модели происходило в среде Google Colab.

Этапы:

  1. Создание дадасета (загрузка исходных изображений (17) через Google Disk)
  2. Приведение изображений к нужному формату
  3. Создание директорий
  4. Подбор промптов к исходным изображениям с помощью модели BLIP
  5. Подключение Hugging Face
  6. Запуск обучения
  7. Сохранение модели в Hugging Face Hub
  8. Генерация изображений с помощью обученной модели

Код:

Original size 1960x1226

Загрузка исходных изображений

Original size 1912x1384

Приведение изображений к нужному формату

Original size 2750x928

Этап создания директорий, проверка

Original size 2888x1146

Подбор промптов к исходным изображениям с помощью модели BLIP

Подключение Hugging Face

0

Запуск обучения

Original size 1884x410

Сохранение модели в Hugging Face Hub

Итоговая серия изображений

В ходе тестирования было найдено, что наиболее подходящий коэффициент lora_scale равен 0.8.

Чтобы изображения были объединены серией, давайте сгенерируем домашних животных в стиле Ганса Гигера!

Original size 1024x1024

Промпт: «painting in Hans Giger style, kittens and puppies run»

Original size 1024x1024

Промпт: «painting in Hans Giger style, goldfish swim in circles»

Original size 1024x1024

Промпт: «painting in Hans Giger style, parakeets chatter»

Original size 1024x1024

Промпт: «painting in Hans Giger style, bunny rabbits hop around»

Original size 1024x1024

Промпт: «painting in Hans Giger style, snails leave slimy trails»

Original size 1024x1024

Промпт: «painting in Hans Giger style, Pet rats enjoy running mazes»

Итог

У меня получилось создать картинки в соответствующей стилю художника Ганса Гигера цветовой гамме, многофигурной композиции и характерной детализации.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more