ChatGPT

На ежегодной конференции OpenAI DevDay 2024 компания представила четыре ключевых обновления, которые делают технологии искусственного интеллекта (ИИ) более доступными и экономичными для разработчиков. В отличие от яркого события прошлого года, в этот раз OpenAI решила сосредоточиться на постепенных улучшениях своих текущих инструментов и API, сделав акцент на поддержке разработчиков и расширении возможностей сообщества.

Четыре главных нововведения на DevDay 2024

На конференции были анонсированы следующие обновления: Тонкая настройка VisionAPI в реальном времени (Realtime API)Дистилляция моделей и Кэширование запросов (Prompt Caching). Эти инструменты отражают новую стратегию компании, направленную на развитие экосистемы разработчиков, а не на прямую конкуренцию в сегменте конечных приложений.

Кэширование запросов: снижение затрат для разработчиков

Одним из самых значительных анонсов стало введение функции Prompt Caching, которая призвана снизить затраты и задержки для разработчиков. Эта система автоматически применяет 50% скидку на обработанные токены, которые модель использовала недавно, что позволяет существенно сократить затраты для приложений, использующих повторяющиеся запросы.

Оливер Годемент, руководитель платформы OpenAI, отметил, что стоимость обработки данных с использованием ИИ за последние два года снизилась почти в 1000 раз. Это открывает новые возможности для стартапов и предприятий, которые раньше не могли позволить себе использование таких технологий из-за высокой стоимости.

Таблица цен chatGPT
Таблица цен, представленная на DevDay 2024 от OpenAI, показывает значительное снижение затрат на использование моделей ИИ: кэшированные входные токены обеспечивают до 50 % экономии по сравнению с некэшированными токенами для различных моделей GPT. Новая модель o1 демонстрирует премиальную цену, отражающую ее расширенные возможности.

Тонкая настройка Vision: новый уровень визуального ИИ

Еще одним важным нововведением стала тонкая настройка Vision для модели GPT-4o, которая позволяет разработчикам настраивать способность модели понимать изображения, используя как текстовые, так и визуальные данные. Это новшество может оказать значительное влияние на такие отрасли, как автономный транспорт, медицинская визуализация и визуальный поиск.

Компания Grab, занимающаяся доставкой еды и транспортными услугами в Юго-Восточной Азии, уже использует эту технологию для улучшения своих картографических сервисов. Благодаря всего лишь 100 примерам компания смогла улучшить точность подсчета полос движения на 20% и точность локализации дорожных знаков на 13%.

API в реальном времени: мост между голосовым управлением и ИИ

Realtime API, также представленная на DevDay, предоставляет разработчикам возможность создавать мультимодальные, низколатентные приложения, такие как системы распознавания голоса и управления голосом. Это позволяет, например, использовать голосовые команды в приложениях, таких как обновленная версия Wanderlust, планировщика путешествий, представленного на прошлогодней конференции.

С помощью нового API пользователи могут вести естественные разговоры с приложением для планирования поездок, включая возможность перебивать систему на полуслове, как в живом диалоге. Хотя это только один пример, API в реальном времени открывает широкие возможности для создания голосовых приложений в различных отраслях, включая образование, клиентскую поддержку и инструменты для людей с ограниченными возможностями.

Дистилляция моделей: доступный ИИ для всех

Дистилляция моделей стала, пожалуй, самым преобразующим обновлением. Эта функция позволяет разработчикам использовать результаты работы передовых моделей, таких как o1-preview и GPT-4o, для улучшения производительности более эффективных, но меньших моделей, таких как GPT-4o mini. Это даёт возможность компаниям, особенно небольшим, использовать возможности больших моделей, не неся огромных затрат на вычислительные ресурсы.

Например, небольшая медицинская стартап-компания, разрабатывающая инструмент для диагностики заболеваний, может обучить компактную модель, обладающую значительной диагностической мощью более крупных моделей, но при этом использующую обычные ноутбуки или планшеты. Это может значительно улучшить качество медицинских услуг в местах с ограниченными ресурсами.

Стратегический поворот OpenAI: развитие экосистемы вместо громких запусков

OpenAI DevDay 2024 стал демонстрацией стратегического изменения вектора компании, которая теперь отдает приоритет развитию экосистемы, а не громким анонсам новых продуктов. Подход OpenAI к улучшению уже существующих инструментов и поддержке разработчиков — это продуманный ответ на вызовы, с которыми сталкивается ИИ-индустрия в условиях усиливающейся конкуренции и растущих проблем с доступностью данных для обучения.

Сейчас OpenAI работает над созданием устойчивой экосистемы, предлагая улучшенные инструменты, сниженные издержки и расширенную поддержку. Этот подход может не сразу привлечь широкую аудиторию, но в долгосрочной перспективе он создаст прочную основу для роста и стабильности в ИИ-секторе.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии