«Яндекс» представила YandexART 1.3 — нейросеть создает еще более реалистичные картинки
Нейросеть работает на основе латентной диффузии — это новая технология для создания изображений. Датасет, на котором обучалась модель, был увеличен в 2,5 раза: теперь YandexART лучше понимает запросы в виде текста и создает еще более реалистичные изображения. Новая версия нейросети используется в «Шедевруме» и позже появится в других сервисах.
- Технология латентной диффузии формирует промежуточное представление картинки в виде латентного кода — компактного описания, содержащего основные данные изображения в сжатом виде. На втором этапе нейросеть разворачивает код в изображение в высоком разрешении.
- Пользователи смогут создавать изображения в форматах 16:9, 4:3 или 3:4. Согласно тестам, нейросеть YandexART 1.3 опережает в 57% случаев Midjourney V5.2 и в 63% — предыдущую версию YandexART 1.2.
