Яндекс выпустил бета-версию 0.1.4 приложения Шедеврум для генерации изображений с помощью нейросети

Экран мобильного устройства с интерфейсом приложения Шедеврум и изображениями в бета-версии 0.1.4

Яндекс показал прототип собственной нейросети для генерации картинок по текстовым запросам пользователей. Увидеть, как она представляет капибару-гитариста, пушистую кошку-осьминожку, человека-кактуса и выполняет другие забавные задания, можно в бета-версии 0.1.4 приложения Шедеврум на Android и iOS.

Картина с известной сценой Ван Гога деревья на фоне ночного неба

Портрет молодой женщины с длинными волнистыми волосами и сияющими голубыми глазами

Шедеврум понимает русский и английский языки и очень любит конкретику. Чем подробнее описание, тем точнее результат. Нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях.

Нейросеть Шедеврума формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться.

Братский сурикат держит чашку и использует ноутбук для генерации изображений через нейросеть на приложении Шедеврум

Картина с изображением спокойного парка с водопадом и цветущими деревьями для приложения Шедеврум от Яндекс

«Мы пока в самом начале пути. В основе Шедеврума прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше», — говорит Алексей Гусаков, руководитель управления машинного интеллекта и исследований Яндекса.

Для просмотра готовых изображений достаточно скачать Шедеврум. Понравившиеся изображения можно лайкать в общей ленте. Самые популярные из них попадают в топ лучших на отдельной вкладке. Чтобы генерировать картинки по собственным запросам, нужно оставить заявку и дождаться её подтверждения. В будущем такую возможность получат все зарегистрированные пользователи.

Сергей Кузнецов

Главный редактор itzine.ru и технический журналист с 15-летним стажем. Специализируется на глубоком тестировании аудиооборудования, фототехники и потребительской электроники. Автор более 5000 материалов, охватывающих широкий спектр тем: от обзоров игровых кресел и сетевого оборудования до аналитики рынка смартфонов и носимых гаджетов. На платформе курирует экспертные разделы и формирует редакционную политику издания.