«Яндекс» представил нейросеть Yandex AI Rendering Technology (YandexART), которая создает реалистичные, детальные изображения и анимацию по текстовому запросу.

YandexART создает изображения методом каскадной диффузии. При обучении модели изображения «портят», добавляя к ним случайный шум, как при диффузии жидкости или газа. Затем их показывают модели, задача которой — «восстановить» изображение.

В «Яндексе» заверили, что, по сравнению с предыдущим поколением диффузионной модели, YandexART создает более реалистичную и детализированную графику.

Чтобы улучшить качество работы нейронной сети, размер обучающего набора данных увеличили в 1,5 раза, до 330 млн картинок с текстовым описанием. Изображения, используемые для обучения YandexART, отбирают с помощью трех режимов фильтрации. Утверждается, что новый алгоритм распознавания текстов помогает ей лучше понимать пожелания пользователей.

Помимо этого, нейросеть «качественнее прорабатывает особенности лиц, глаз и рук, что позволяет ей делать фотореалистичные портреты», добавили в «Яндексе».

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии