OpenAI делает свой обновленный генератор изображений доступным для разработчиков

В среду OpenAI представила новую технологию, которая легла в основу усовершенствованной функции генерации изображений в ChatGPT, интегрировав её в свой API. Это нововведение позволяет разработчикам внедрять функцию генерации изображений в свои приложения и сервисы.

Новый генератор изображений OpenAI, запущенный для большинства пользователей ChatGPT в конце марта, быстро завоевал популярность. Это стало значительным успехом для OpenAI, приведя к миллионам новых пользователей ChatGPT и значительно расширив возможности компании. По данным OpenAI, более 130 миллионов пользователей ChatGPT создали свыше 700 миллионов изображений всего за первую неделю после запуска инструмента.

Функция генерации изображений в API OpenAI основана на модели искусственного интеллекта под названием «gpt-image-1». Эта многомодальная модель позволяет создавать изображения в различных стилях, следовать пользовательским запросам и визуализировать текст с учетом знаний о мире.

Разработчики могут одновременно генерировать несколько изображений с помощью gpt-image-1 и контролировать как качество генерации, так и скорость процесса. OpenAI утверждает, что в gpt-image-1 применяются те же меры безопасности, что и при создании изображений в ChatGPT. Это включает предосторожности, которые предотвращают создание контента, нарушающего политику компании. Разработчики могут настраивать уровень чувствительности к модерации: «автоматически» для стандартной фильтрации или «низко» для более свободной фильтрации. Согласно документации OpenAI, низкий уровень фильтрации ограничивает количество категорий контента, который может быть неподходящим по возрасту.

Кроме того, все изображения, созданные с помощью gpt-image-1, имеют водяные знаки и метаданные C2PA, что позволяет идентифицировать их как произведения искусственного интеллекта на поддерживаемых платформах и приложениях.

Цены на использование составляют 5 долларов за миллион входных токенов текста, 10 долларов за миллион токенов для изображений и 40 долларов за миллион выходных токенов для изображений. (Токены представляют собой необработанные фрагменты данных, обрабатываемые моделью.) По информации OpenAI, это эквивалентно примерно 2 центам за квадратное изображение низкого качества, 7 центам за среднее качество и 19 центам за высокое качество.

OpenAI также сообщает о том, что такие компании как Adobe, Airtable, Wix, Instacart, GoDaddy, Canva и Figma уже используют gpt-image-1 или находятся на стадии экспериментов с этой моделью. Например, дизайнерская платформа Figma теперь позволяет пользователям создавать и редактировать изображения с помощью gpt-image-1, а Instacart тестирует эту модель для генерации изображений рецептов и списков покупок.