Команда xAI провела спринт, где инженеры сосредоточились на улучшении ответов Grok по игре Baldur’s Gate. Через несколько дней модель начала выдавать подробные рекомендации, используя термины типа «save‑scumming» и таблицы расчётов.
Сравнение с конкурентами
Автор теста «BaldurBench» задал пять типовых вопросов четырём моделям: Grok, ChatGPT, Claude и Gemini. Grok дал плотные ответы и часто использовал табличный формат. ChatGPT формировал ответы маркерами, Gemini подчёркивал ключевые слова, а Claude старался избегать спойлеров и советовал просто «играть для удовольствия».
Что это значит
Теперь Grok сравним с другими моделями, а быстрое адаптирование под конкретную задачу показывает, что xAI умеет добавлять специализированные функции. Это открывает путь для использования подобных ИИ в игровых справочниках, обучающих платформах и других нишевых сервисах.