Статьи

Fooocus – свой AI для генерации изображений

Fooocus – доступная и достаточно качественная альтернатива онлайн-генераторам изображений с искусственным интеллектом типа Midjourney или Stable Diffusion.

Этот программный пакет работает оффлайн, абсолютно бесплатен, достаточно функционален и удобен в использовании.

Для работы с Fooocus используется графический интерфейс — страничка в браузере, являющаяся надстройкой над программным обеспечением генератора изображений.

Достаточно аппетитный на вид десерт, сгенерированный в Fooocus:

Программа создает изображения согласно запросу пользователя (ключевым словам), сформулированного на английском языке (используются наборы слов в позитивном и нежелательном контексте).

В программный комплекс встроен искусственный интеллект версии GPT2, дополняющий список ключевых слов для улучшения качества картинки.

В качестве базы-основы можно использовать и свои изображения, в том числе для генерации лица, позы и антуража картинки.

Лаконичный интерфейс программы Fooocus, запущенной с настройками по умолчанию (страница в интернет-браузере, обращающаяся к локальному адресу 127.0.0.1:7865):

Для работы с Fooocus нужен достаточно мощный компьютер, желательно использование современной видеокарты Nvidia с не менее чем 8 GB памяти, желательно установленной непосредственно в слот PCI-E материнской платы (не через райзер). После ввода ключевых слов, описывающих желаемую картинку, начнется генерация изображения.

Автором успешно протестирована работа Fooocus на компьютере с шестигигабайтной видеокартой Nvidia GTX 1660S, подключенной через PCI-E райзер. Скорость работы на аналогичном компьютере с видеокартой, подключенной в разъем материнки, ощутимо быстрее.

Для установки Fooocus в Windows нужно скачать на Github архив с программным пакетом (например, на странице пользователя lllyasviel), разархивировать содержимое и запустить батник установки.

Архив с последней версией Fooocus находится в разделе релизов каталога Fooocus на Github пользователя lllyasviel:

Батник установки (файл run.bat) можно скачать по ссылке на основной странице пользователя lllyasviel/Fooocus:

Перед установкой нужно привести вид инсталляционной папки к виду, показанному на рисунке выше (перенести в нее самый новый каталог с исходниками, изменить его название на Foocus).

После распаковки можно запускать генерацию изображений в одном из трех режимов: стандартный, аниме и реалистичный. Для каждого из них есть свой батник:

  • run.bat
  • run_anime.bat
  • run_realistic.bat

Обычно (но не всегда) самая высокая скорость работы достигается на новейших драйверах Nvidia.

Молодой Сатоши Накамото, сгенерированный в Foocus:

При желании, пакетом Fooocus можно пользоваться и в Linux. Установка в xubuntu 22.04 производилась следующими командами:

git clone https://github.com/lllyasviel/Fooocus.git
cd Fooocus
pip3 install -r requirements_versions.txt

Запуск программы в Linux из ее каталога осуществляется командой (для генерации реалистичных картинок):

python3 entry_with_update.py --preset realistic

В Fooocus при генерации изображений можно использовать различные гибкие настройки, которые открываются при активации полей Input Image и Advanced, среди которых:

  • изменение разрешения/соотношения сторон картинки, качество, степень изменения исходника, стиль, модель-основа и другие;
  • использование в качестве основы генерируемого изображения своей картинки;
  • использование в качестве базового своего изображения лица, позы, фона картинки;
  • добавление объекта на существующую картинку и т.д.

Для более качественной генерации изображений можно использовать программные модели, созданные на основе набора своих картинок. Для этого нужны программы-трейнеры, например, пакет kohya_ss. Теоретически можно использовать собственную нейросеть для ретуши фотографий, их кардинального изменения и создания новых… Простор для баловства творчества безграничен…

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *