В пилотном эксперименте Anthropic открыла закрытый рынок, где AI‑агенты играли роли покупателя и продавца одновременно. Участниками стали 69 сотрудников, каждому выдано $100 в виде подарочных карт для покупок у коллег.
Результаты
За время теста было завершено 186 сделок на сумму более $4 000. Компания представила четыре версии платформы: одну «реальную», где сделки действительно исполнялись, и три исследовательские, использующие разные модели агентов.
Выводы
Участники, обслуживаемые более продвинутой моделью, получали объективно лучшие результаты, однако сами пользователи не замечали различий. Это показывает, что менее эффективные модели могут приводить к менее выгодным сделкам, оставаясь незамеченными. Инструкции, заданные агентам в начале, не изменили вероятность продажи или цены.