«Яндекс» представил обновленную нейросеть YandexART 1.3 с улучшенными возможностями. Благодаря новой технологии генерации изображений и увеличению датасета в 2,5 раза, искусственный интеллект теперь лучше понимает запросы и создает более реалистичные картинки.
Технология латентной диффузии не только улучшает графику, но и требует меньше вычислительных ресурсов. Она создает промежуточное представление изображения в виде латентного кода, который нейросеть разворачивает в полноценное изображение за один шаг. С помощью YandexART 1.3 можно создавать изображения в различных форматах: 16:9, 4:3 или 3:4.
Для лучшего понимания запросов разработчики добавили в датасет синтетические тексты — подробные описания изображений, сгенерированные нейросетью. Кроме того, в новой модели используются два текстовых энкодера вместо одного. С их помощью YandexART распознает текстовый запрос пользователя и переводит его на машинный язык.
Новая YandexART 1.3 уже доступна в «Шедевруме» и других сервисах «Яндекса».