«Яндекс» улучшил генерацию изображений с текстом на русском языке
«Яндекс» выпустил обновленную версию своей визуально-генеративной модели Яндекс — Alice AI ART. Она теперь лучше справляется с созданием изображений, в которых есть русскоязычные надписи.
Новая версия модели решает одну из ключевых проблем генеративных нейросетей — ошибки в русском тексте на изображениях. Обновленный инструмент доступен в чате с Алисой AI, а также для бизнеса через платформу Yandex AI Studio. Там же модель можно подключать к ИИ-агентам.
- По словам разработчиков, система теперь умеет формировать более точные и длинные надписи на русском языке. Это позволяет создавать постеры, открытки и афиши. Бизнес может использовать инструмент для рекламных материалов, презентаций и лендингов.
- В компании объяснили, что проблема с русским языком у многих нейросетей связана с нехваткой данных в открытых дата-сетах. Чтобы улучшить качество, модель обучили на собственных материалах. В предобучение включили около 30 млн примеров с текстами. Для донастройки добавили примерно 100 тыс. изображений с подробной разметкой.
- Появился механизм перефразирования запросов. Теперь система может уточнять смысл нечетких формулировок. Например, выражение «наша столица» она интерпретирует как «Москва».
- По данным компании, после обновления модель стала в 3 раза чаще корректно воспроизводить русский текст. В «Яндексе» также утверждают, что модель лучше учитывает российский культурный контекст. Так, по запросу о русском народном ансамбле она может создать изображение с гармонистами и балалаечниками. А при описании праздничного стола — с икрой, соленьями и самоваром.
- Для корпоративных клиентов представлен инструмент Image Generation Tool. Он позволяет использовать генерацию изображений внутри ИИ-агентов: такие системы способны автоматически создавать визуалы для карточек товаров и рекламы. При этом они смогут опираться на данные из внутренних корпоративных систем и брендбуков.