Илон Маск под присягой подтвердил, что xAI использовала модели OpenAI для обучения чат-бота Grok. Признание прозвучало в ходе судебного процесса 30 апреля и впервые официально зафиксировало давние подозрения о практике дистилляции между американскими ИИ-лабораториями.
Дистилляция — это процесс, при котором новую модель тренируют, систематически опрашивая чужой публичный чат-бот или API и используя ответы как обучающие данные. До сих пор индустрия обсуждала её преимущественно в связи с китайскими компаниями, которые так выпускают открытые модели, почти не уступающие американским по качеству, но в разы дешевле. В кулуарах разработчики давно предполагали, что и сами лидеры рынка прибегают к подобным приёмам, чтобы не отстать от конкурентов.
Параллельно OpenAI, Anthropic и Google через Frontier Model Forum запустили совместную инициативу по обмену информацией о методах противодействия дистилляции. Задача — выявлять подозрительные паттерны массовых запросов и блокировать аккаунты, систематически прокачивающие через API большие объёмы данных. Раньше эти усилия были направлены прежде всего против китайских игроков, теперь они получают новый смысл и внутри США.
Условия использования OpenAI прямо запрещают применять выходные данные сервиса для тренировки конкурирующих моделей, и формально xAI рискует столкнуться с иском о нарушении договора. На запрос комментария OpenAI не ответила, а Маск находится с компанией в многолетнем конфликте, начавшемся после его выхода из совета директоров и продолжившемся отдельным судебным разбирательством о смене корпоративной структуры. Эпизод обнажает парадокс отрасли: лаборатории, тратящие миллиарды на тренировку фронтирных моделей, одновременно открывают API, через который конкуренты могут практически бесплатно получать качественные данные.
Источник: TechCrunch (techcrunch.com)