Nvidia Research представила сегодня GauGAN, генеративную систему искусственного интеллекта, которая позволяет создавать реалистичные изображения, которых никогда не существовало. Исследование и демонстрация новой системы были продемонстрированы сегодня на GPU Tech Conference (GTC) в Сан-Хосе, Калифорния.
GauGAN основывается на знаниях системы Pix2Pix, представленной в прошлом году, которая может визуализировать виртуальные миры, сказал вице-президент Nvidia по прикладным исследованиям глубокого обучения Брайан Катандзаро, но Pix2Pix не может рисовать пейзажи, потому что оставляет артефакты на получающемся изображении.
Нейронная сеть GauGAN обучена миллиону изображений с открытым исходным кодом с Flickr и в ней налажены взаимосвязи между более чем 180 объектами, такими как снег, деревья, вода, цветы, кусты, холмы или горы. Понимание того, как объекты связаны друг с другом, означает, что дерево рядом с водой будет отражаться, или когда сезон изменится и на земле будет снег, деревья будут изображаться без листьев. Также возможна передача стиля, поэтому система может понимать теплый закат или отображать более прохладные огни городского горизонта.
Приложение GauGAN использует карту сегментации, которая действует как книжка-раскраска, которая описывает, где находятся объекты, но не дает подробностей. Компании ещё нужно немного времени, чтобы доделать приложение. И скоро GauGAN появится площадке для демонстрации возможностей нейросетей AI Playground, которую Nvidia тоже представила на GTC 2019.