Логотип Яндекс: красный символ «Я» и черная надпись на светлом фоне

«Яндекс» представил нейросеть Yandex AI Rendering Technology (YandexART), которая создает реалистичные, детальные изображения и анимацию по текстовому запросу.

Сравнение старой модели автомобиля и робота YandexART на Красной площади

YandexART создает изображения методом каскадной диффузии. При обучении модели изображения «портят», добавляя к ним случайный шум, как при диффузии жидкости или газа. Затем их показывают модели, задача которой — «восстановить» изображение.

Сравнение предыдущей модели и YandexART изображение крупным планом

В «Яндексе» заверили, что, по сравнению с предыдущим поколением диффузионной модели, YandexART создает более реалистичную и детализированную графику.

Чтобы улучшить качество работы нейронной сети, размер обучающего набора данных увеличили в 1,5 раза, до 330 млн картинок с текстовым описанием. Изображения, используемые для обучения YandexART, отбирают с помощью трех режимов фильтрации. Утверждается, что новый алгоритм распознавания текстов помогает ей лучше понимать пожелания пользователей.

Портрет пожилого мужчины в фотореализме с ярко выраженными морщинами и седыми волосами

Помимо этого, нейросеть «качественнее прорабатывает особенности лиц, глаз и рук, что позволяет ей делать фотореалистичные портреты», добавили в «Яндексе».

Leave a reply