Технологии

Anthropic создала тестовый рынок для торговли агентами

Компания Anthropic провела эксперимент «Project Deal», в котором AI‑агенты одновременно выступали покупателями и продавцами, заключая реальные сделки. В пилоте участвовали 69 сотрудников, каждый получил $100 в виде подарочных карт, и было оформлено 186 сделок на сумму более $4 000.

Было обнаружено, что более продвинутые модели показывали лучшую эффективность, хотя пользователи не ощущали разницы.

Сигнал: различия в качестве моделей могут влиять на результаты сделок, оставаясь незаметными для участников.

В пилотном эксперименте Anthropic открыла закрытый рынок, где AI‑агенты играли роли покупателя и продавца одновременно. Участниками стали 69 сотрудников, каждому выдано $100 в виде подарочных карт для покупок у коллег.

Результаты

За время теста было завершено 186 сделок на сумму более $4 000. Компания представила четыре версии платформы: одну «реальную», где сделки действительно исполнялись, и три исследовательские, использующие разные модели агентов.

Выводы

Участники, обслуживаемые более продвинутой моделью, получали объективно лучшие результаты, однако сами пользователи не замечали различий. Это показывает, что менее эффективные модели могут приводить к менее выгодным сделкам, оставаясь незамеченными. Инструкции, заданные агентам в начале, не изменили вероятность продажи или цены.

Все материалы