«Яндекс» представил нейросеть Yandex AI Rendering Technology (YandexART), которая создает реалистичные, детальные изображения и анимацию по текстовому запросу.
YandexART создает изображения методом каскадной диффузии. При обучении модели изображения «портят», добавляя к ним случайный шум, как при диффузии жидкости или газа. Затем их показывают модели, задача которой — «восстановить» изображение.
В «Яндексе» заверили, что, по сравнению с предыдущим поколением диффузионной модели, YandexART создает более реалистичную и детализированную графику.
Чтобы улучшить качество работы нейронной сети, размер обучающего набора данных увеличили в 1,5 раза, до 330 млн картинок с текстовым описанием. Изображения, используемые для обучения YandexART, отбирают с помощью трех режимов фильтрации. Утверждается, что новый алгоритм распознавания текстов помогает ей лучше понимать пожелания пользователей.
Помимо этого, нейросеть «качественнее прорабатывает особенности лиц, глаз и рук, что позволяет ей делать фотореалистичные портреты», добавили в «Яндексе».