Модель OpenAI o1 скрывает процесс мышления, давая преимущество open-source решениям (the universe of open source large language models is small in number e1706200036796.png)

OpenAI представила новый подход к решению задач с помощью крупных языковых моделей (LLMs) в своей модели o1, недавно получившей масштабное обновление. Однако, несмотря на лидерство OpenAI в создании моделей с мощными способностями к рассуждению, открытые аналоги начинают быстро набирать популярность, предлагая свои преимущества.

Особенности модели o1

Модели вроде o1, которые часто называют крупными моделями рассуждений (LRM), используют дополнительные вычислительные циклы во время выполнения запросов. Это позволяет им «думать», анализировать задачи, проверять свои ответы и исправлять ошибки. Благодаря этому они успешно решают сложные задачи, такие как программирование, математика и анализ данных, с которыми традиционные LLM испытывают трудности.

Однако разработчики выразили смешанные чувства к обновлённой версии o1. Одни отмечают её невероятные способности, другие жалуются на нелогичные ответы, игнорирование инструкций или странные изменения в коде.

Секретность OpenAI

Основная причина недовольства — секретность OpenAI. Модель o1 скрывает процесс мышления, предоставляя пользователям только финальный ответ и общее время работы модели. Это сделано для упрощения пользовательского опыта и защиты коммерческих секретов. Цепочка рассуждений — процесс генерации промежуточных «мыслей», которые помогают модели прийти к окончательному решению, — рассматривается OpenAI как ключевой конкурентный актив.

Даже команды, занимавшиеся тестированием модели, не имели доступа к этим данным, что вызвало предположения о том, что OpenAI могла снизить качество работы модели ради экономии затрат на вычисления.

Прозрачность в open-source моделях

Открытые альтернативы, такие как Qwen with Questions от Alibaba или DeepSeek R1, предоставляют полный доступ к цепочке рассуждений. Это позволяет разработчикам анализировать промежуточные шаги модели, оптимизировать запросы и улучшать результаты. Прозрачность особенно важна для корпоративных приложений, где стабильность и предсказуемость работы модели критичны.

Открытые модели предоставляют полный контроль над их внутренними процессами, что делает их более гибкими для выполнения специфических задач. В отличие от частных решений, их настройки можно адаптировать под конкретные нужды бизнеса без риска нарушения работы из-за внезапных изменений.

Конкуренция между частными и открытыми решениями

Модель o1 остаётся лидером по точности и удобству использования для общих задач, таких как разовые запросы или генерация ответов на ад-хок вопросы. Однако open-source решения быстро догоняют, и в ближайшие месяцы ожидается появление новых конкурентоспособных моделей, которые предложат разработчикам больше контроля и гибкости.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии