Экран смартфона с иконками приложений Google и Play Store

Google начала предлагать отдельным разработчикам из Play Store деньги за доступ к исходному коду их приложений. Речь идет не о покупке бизнеса или эксклюзивных прав, а о неэксклюзивной лицензии, которая позволит компании использовать код для обучения своих инструментов программирования на базе ИИ. Схема выглядит как попытка получить качественные обучающие данные без очередного спора о скрейпинге и авторских правах.

О рассылке первым сообщило издание 404 Media. По его данным, письма получили не все разработчики, а владельцы приложений с миллионами загрузок. В обращении Google предлагает «дополнительный доход от ваших приложений», при этом прямо не пишет об ИИ в тексте письма. Однако ссылка внутри ведет на страницу о партнерствах для улучшения ИИ-продуктов компании.

Разработчики сохраняют право собственности на код и могут лицензировать его другим компаниям. Для Google это снижает юридические риски и одновременно открывает доступ к тому, чего часто не хватает генеративным моделям для программирования: рабочим, поддерживаемым, реальным кодовым базам, а не фрагментам с форумов и учебных репозиториев. В этой нише конкуренция давно вышла за пределы автодополнения. Anthropic продвигает Claude Code, Microsoft развивает GitHub Copilot, а Google в 2025 году представила агент для программирования Gemini Code Assist и связанные с ним инструменты.

Подход Google заметно отличается от практики, которая несколько лет вызывала претензии у правообладателей. Издатели, художники и платформы регулярно обвиняли ИИ-компании в использовании контента без разрешения. На рынке кода этот конфликт тоже был. Против GitHub, Microsoft и OpenAI в США подавали иск из-за обучения Copilot на публичных репозиториях, утверждая, что модель воспроизводит участки кода без соблюдения условий лицензий. Для Google закупка лицензий у разработчиков выглядит не только как вопрос качества данных, но и как страховка от такого сценария.

Google и код приложений для ИИ

Это не первая попытка Google легализовать сбор данных для генеративных моделей через коммерческие соглашения. В 2024 году компания заключила сделку с Reddit примерно на $60 млн в год, чтобы использовать контент платформы для обучения ИИ. Тогда рынок воспринял это как сигнал, что эпоха бесплатного «соскребли и пошли дальше» заканчивается хотя бы для крупных игроков с заметными юридическими рисками.

С кодом ситуация еще чувствительнее. Публичный репозиторий не означает автоматического согласия на обучение модели, тем более если результат потом продается как коммерческий сервис. Лицензии open source регулируют распространение и модификацию кода, но вопрос обучения моделей на таких данных до сих пор остается спорным в судах и у регуляторов. Поэтому договор с разработчиком, пусть и неэксклюзивный, для корпорации удобнее, чем очередной раунд споров о добросовестном использовании.

Есть и чисто продуктовая причина. Лучшие ИИ-инструменты для программирования упираются не только в размер модели, но и в качество датасета. Код из популярных приложений полезен тем, что он проходит через реальные релизы, обновления SDK, требования магазинов приложений и ограничения мобильных платформ. Это более ценный материал для обучения, чем набор разрозненных примеров из открытых репозиториев, где много учебных проектов, заброшенных библиотек и кода без реального продакшн-цикла.

Google, судя по описанию рассылки, выбирает именно такие активы. Компания обращается к разработчикам с крупной пользовательской базой, то есть к тем, у кого выше шанс получить зрелую архитектуру, поддержку нескольких версий Android, аналитику сбоев и оптимизацию под реальные устройства. Если эта схема масштабируется, Google может собрать корпус мобильного кода, который будет полезен для улучшения генерации интерфейсов, работы с API Android и исправления ошибок в существующих приложениях.

Тихий характер программы тоже показателен. Google не скрывает саму идею партнерств для обучения ИИ, но в письмах, как следует из публикации 404 Media, избегает прямой формулировки. Вероятная причина проста: для части разработчиков продажа кода в обучающий датасет звучит гораздо чувствительнее, чем «дополнительная монетизация». Особенно если речь идет о компаниях, которые уже используют сторонние ИИ-сервисы и не хотят помогать одному поставщику получить преимущество над другим.

  • Google покупает неэксклюзивную лицензию, а не права на приложение
  • Целью названы реальные качественные кодовые базы
  • Рассылка идет разработчикам с миллионами загрузок
  • В письмах нет прямого упоминания обучения ИИ

Для рынка это еще один признак сдвига от бесплатного сбора данных к их закупке. По оценке Bloomberg Intelligence, выручка рынка генеративного ИИ может превысить $1,3 трлн к 2032 году, и борьба за качественные датасеты уже стала отдельным видом расходов. На этом фоне код приложений выглядит особенно дорогим сырьем: его меньше, чем текстов из интернета, а ценность для коммерческих ИИ-ассистентов выше.

Следующий вопрос для Google не в том, удастся ли собрать часть таких лицензий, а хватит ли этого, чтобы сократить отставание от конкурентов в инструментах для разработчиков. Ответ рынок получит по обновлениям Gemini Code Assist в ближайшие кварталы. Если новые версии начнут заметно лучше работать с мобильными проектами и крупными кодовыми базами, тихая закупка исходников быстро перестанет быть тихой.

Сергей Кузнецов
Главный редактор itzine.ru и технический журналист с 15-летним стажем. Специализируется на глубоком тестировании аудиооборудования, фототехники и потребительской электроники. Автор более 5000 материалов, охватывающих широкий спектр тем: от обзоров игровых кресел и сетевого оборудования до аналитики рынка смартфонов и носимых гаджетов. На платформе курирует экспертные разделы и формирует редакционную политику издания.

Leave a reply