
Fooocus – свой AI для генерации изображений
Fooocus – доступная и достаточно качественная альтернатива онлайн-генераторам изображений с искусственным интеллектом типа Midjourney или Stable Diffusion.
Этот программный пакет работает оффлайн, абсолютно бесплатен, достаточно функционален и удобен в использовании.
Для работы с Fooocus используется графический интерфейс — страничка в браузере, являющаяся надстройкой над программным обеспечением генератора изображений.
Достаточно аппетитный на вид десерт, сгенерированный в Fooocus:

Программа создает изображения согласно запросу пользователя (ключевым словам), сформулированного на английском языке (используются наборы слов в позитивном и нежелательном контексте).
В программный комплекс встроен искусственный интеллект версии GPT2, дополняющий список ключевых слов для улучшения качества картинки.
В качестве базы-основы можно использовать и свои изображения, в том числе для генерации лица, позы и антуража картинки.
Лаконичный интерфейс программы Fooocus, запущенной с настройками по умолчанию (страница в интернет-браузере, обращающаяся к локальному адресу 127.0.0.1:7865):

Для работы с Fooocus нужен достаточно мощный компьютер, желательно использование современной видеокарты Nvidia с не менее чем 8 GB памяти, желательно установленной непосредственно в слот PCI-E материнской платы (не через райзер). После ввода ключевых слов, описывающих желаемую картинку, начнется генерация изображения.
Автором успешно протестирована работа Fooocus на компьютере с шестигигабайтной видеокартой Nvidia GTX 1660S, подключенной через PCI-E райзер. Скорость работы на аналогичном компьютере с видеокартой, подключенной в разъем материнки, ощутимо быстрее.
Для установки Fooocus в Windows нужно скачать на Github архив с программным пакетом (например, на странице пользователя lllyasviel), разархивировать содержимое и запустить батник установки.
Архив с последней версией Fooocus находится в разделе релизов каталога Fooocus на Github пользователя lllyasviel:

Батник установки (файл run.bat) можно скачать по ссылке на основной странице пользователя lllyasviel/Fooocus:

Перед установкой нужно привести вид инсталляционной папки к виду, показанному на рисунке выше (перенести в нее самый новый каталог с исходниками, изменить его название на Foocus).

После распаковки можно запускать генерацию изображений в одном из трех режимов: стандартный, аниме и реалистичный. Для каждого из них есть свой батник:
- run.bat
- run_anime.bat
- run_realistic.bat
Обычно (но не всегда) самая высокая скорость работы достигается на новейших драйверах Nvidia.
Молодой Сатоши Накамото, сгенерированный в Foocus:

При желании, пакетом Fooocus можно пользоваться и в Linux. Установка в xubuntu 22.04 производилась следующими командами:
git clone https://github.com/lllyasviel/Fooocus.git
cd Fooocus
pip3 install -r requirements_versions.txt
Запуск программы в Linux из ее каталога осуществляется командой (для генерации реалистичных картинок):
python3 entry_with_update.py --preset realistic
В Fooocus при генерации изображений можно использовать различные гибкие настройки, которые открываются при активации полей Input Image и Advanced, среди которых:
- изменение разрешения/соотношения сторон картинки, качество, степень изменения исходника, стиль, модель-основа и другие;
- использование в качестве основы генерируемого изображения своей картинки;
- использование в качестве базового своего изображения лица, позы, фона картинки;
- добавление объекта на существующую картинку и т.д.
Для более качественной генерации изображений можно использовать программные модели, созданные на основе набора своих картинок. Для этого нужны программы-трейнеры, например, пакет kohya_ss. Теоретически можно использовать собственную нейросеть для ретуши фотографий, их кардинального изменения и создания новых… Простор для баловства творчества безграничен…


