Сегодня исполняется два года с момента запуска Сбером нейросети Kandinsky, которая позволила пользователям по всему миру создать свыше 600 млн изображений. Это событие знаменует значительный вклад в развитие технологий генерации изображений по текстовому описанию.
Содержание
История создания Kandinsky
Два года назад, 14 июня 2022 года, Сбер представил свою первую нейросеть для генерации изображений по тексту на русском языке – Kandinsky. Эта инновация стала возможной благодаря совместным усилиям исследователей и инженеров из Sber AI и SberDevices при поддержке ученых из Института AIRI. Название модели выбрано в честь Василия Кандинского, известного русского художника-абстракциониста и теоретика искусства.
Эволюция и развитие нейросети
Kandinsky является продолжением нейросети ruDALL-E, представленной 2 ноября 2021 года. В отличие от предшественницы, которая была обучена на 200 млн изображений с русскоязычными описаниями, Kandinsky демонстрирует значительно более высокое качество генерации. Модель прошла несколько этапов обновления, в результате чего были созданы версии Kandinsky 2.0, 2.1, 2.2, 3.0 и 3.1, а также семейство моделей Kandinsky Video для генерации видео по тексту.
Технические достижения и возможности
Kandinsky использует различные подходы к генерации изображений, включая авторегрессионные трансформерные модели и диффузионные модели с image prior-блоком. Эти технологии позволяют создавать изображения высокого качества, учитывающие культурно-исторический контекст. Например, Kandinsky может создавать изображения в стилях гжель и хохлома. Помимо генерации изображений, модель обладает возможностями редактирования и инструктивной генерации, включая дорисовывание, исправление, смешивание, стилизацию и замену объектов.
Популярность и признание
Kandinsky 2.1 стала одной из самых быстрорастущих нейросетей в мире, привлекая более 1 млн уникальных пользователей всего за четыре дня после релиза 4 апреля 2023 года. Модель Kandinsky 2.2 заняла первое место по темпу роста и стала второй по популярности среди разработчиков после Stable Diffusion по версии AI-ресурса Hugging Face. Также Kandinsky стала одной из самых упоминаемых российских нейросетей в социальных медиа в 2023–2024 годах, согласно исследованию Brand Analytics.
Применение в реальном мире
Нейросеть Kandinsky используется в различных проектах, способствующих сохранению и популяризации культурного наследия России. В рамках проекта «Возрождённая коллекция» нейросеть помогла восстановить образы утраченных картин известных русских художников. Муралы, созданные с участием Kandinsky 2.2, украсили школы в Волгограде, а Императорский фарфоровый завод выпустил коллекцию кружек с рисунками, созданными нейросетью.