Нейросети Kandinsky исполнилось два года (evolyucziya kandinsky)

Сегодня исполняется два года с момента запуска Сбером нейросети Kandinsky, которая позволила пользователям по всему миру создать свыше 600 млн изображений. Это событие знаменует значительный вклад в развитие технологий генерации изображений по текстовому описанию.

История создания Kandinsky

Два года назад, 14 июня 2022 года, Сбер представил свою первую нейросеть для генерации изображений по тексту на русском языке – Kandinsky. Эта инновация стала возможной благодаря совместным усилиям исследователей и инженеров из Sber AI и SberDevices при поддержке ученых из Института AIRI. Название модели выбрано в честь Василия Кандинского, известного русского художника-абстракциониста и теоретика искусства.

Эволюция и развитие нейросети

Kandinsky является продолжением нейросети ruDALL-E, представленной 2 ноября 2021 года. В отличие от предшественницы, которая была обучена на 200 млн изображений с русскоязычными описаниями, Kandinsky демонстрирует значительно более высокое качество генерации. Модель прошла несколько этапов обновления, в результате чего были созданы версии Kandinsky 2.0, 2.1, 2.2, 3.0 и 3.1, а также семейство моделей Kandinsky Video для генерации видео по тексту.

Сгенерировано в Kandinsky
Сгенерировано в Kandinsky

Технические достижения и возможности

Kandinsky использует различные подходы к генерации изображений, включая авторегрессионные трансформерные модели и диффузионные модели с image prior-блоком. Эти технологии позволяют создавать изображения высокого качества, учитывающие культурно-исторический контекст. Например, Kandinsky может создавать изображения в стилях гжель и хохлома. Помимо генерации изображений, модель обладает возможностями редактирования и инструктивной генерации, включая дорисовывание, исправление, смешивание, стилизацию и замену объектов.

Популярность и признание

Kandinsky 2.1 стала одной из самых быстрорастущих нейросетей в мире, привлекая более 1 млн уникальных пользователей всего за четыре дня после релиза 4 апреля 2023 года. Модель Kandinsky 2.2 заняла первое место по темпу роста и стала второй по популярности среди разработчиков после Stable Diffusion по версии AI-ресурса Hugging Face. Также Kandinsky стала одной из самых упоминаемых российских нейросетей в социальных медиа в 2023–2024 годах, согласно исследованию Brand Analytics.

Применение в реальном мире

Нейросеть Kandinsky используется в различных проектах, способствующих сохранению и популяризации культурного наследия России. В рамках проекта «Возрождённая коллекция» нейросеть помогла восстановить образы утраченных картин известных русских художников. Муралы, созданные с участием Kandinsky 2.2, украсили школы в Волгограде, а Императорский фарфоровый завод выпустил коллекцию кружек с рисунками, созданными нейросетью.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
1 Комментарий
Межтекстовые Отзывы
Посмотреть все комментарии