OpenAI сделал новейшую модель ИИ — GPT-4o (mira gpt4o.jpg)

Она быстрее GPT4-turbo и в 2 раза дешевле!

OpenAI выпустил новую флагманскую модель генеративного ИИ под названием GPT-4o, которая будет «итеративно» внедряться в продукты компании для разработчиков и потребителей в течение следующих нескольких недель. (Буква «o» в GPT-4 означает «omni»).

Технический директор OpenAI Мури Мурати заявил, что GPT-4o обеспечивает интеллект «уровня GPT-4», но улучшает возможности GPT-4 в области текста и зрения, а также аудио.


«GPT-4o может работать с голосом, текстом и зрением», — сказал Мурати во время ключевой презентации в офисе OpenAI. «И это невероятно важно, потому что мы смотрим на будущее взаимодействия между нами и машинами».

GPT-4 Turbo — предыдущая ведущая модель OpenAI, улучшенная версия GPT-4 — обучалась комбинации изображений и текста и могла анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений или даже описание содержания этих изображений. Но GPT-4o добавляет к этому еще и речь.

Что это дает в конкретном случае? Множество вещей.

GPT-4o значительно улучшает работу ChatGPT — ChatGPT — это вирусный чатбот OpenAI, работающий на основе искусственного интеллекта. ChatGPT уже давно предлагает голосовой режим, который транскрибирует текст из ChatGPT с помощью модели преобразования текста в речь. Но GPT-4o расширяет его возможности, позволяя пользователям взаимодействовать с ChatGPT как с помощником.

Например, пользователи могут задать ChatGPT, работающему на GPT-4o, вопрос и прервать ChatGPT во время ответа. По словам OpenAI, модель обеспечивает реакцию в режиме «реального времени» и даже может улавливать эмоции в голосе пользователя и генерировать голос в «различных эмоциональных стилях».

GPT-4o также улучшает возможности зрения ChatGPT. Получив фотографию или экран рабочего стола, ChatGPT теперь может быстро отвечать на связанные с ней вопросы, от «Что происходит в этом программном коде» до «Какая марка рубашки на этом человеке?».


«Мы знаем, что эти модели [становятся] все сложнее и сложнее, но мы хотим, чтобы опыт взаимодействия стал более естественным, легким, и чтобы вы вообще не фокусировались на пользовательском интерфейсе, а просто сосредоточились на сотрудничестве с [GPT]», — говорит Мурати.

По утверждению OpenAI, GPT-4o также стал более многоязычным, улучшив производительность на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее GPT-4 (в частности, GPT-4 Turbo), в два раза дешевле и имеет более высокие ограничения по скорости.

Подписаться
Уведомить о
2 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии