Компания признала, что этот тест, названный Project Deal, был лишь "пилотным экспериментом с самовыбранной группой участников", состоящей из 69 сотрудников Anthropic. Им был выделен бюджет в размере $100, который выплачивался через подарочные карты, для покупки товаров у своих коллег. Тем не менее, Anthropic отметила, что была "поражена тем, насколько хорошо сработал Project Deal", в рамках которого было заключено 186 сделок на общую сумму более $4000. Компания провела четыре отдельных рынка с различными моделями — один из них был "реальным" (где все участники представлялись самой продвинутой моделью компании, и сделки действительно исполнялись после эксперимента), а три других использовались для изучения.
Согласно данным Anthropic, когда пользователи представлены более продвинутыми моделями, они получают "объективно лучшие результаты". Однако пользователи, похоже, не замечали этой разницы, что поднимает вопрос о возможных "разрывах в качестве агентов", когда "люди на проигрывающей стороне могут не осознавать, что находятся в худшем положении". Также было отмечено, что первоначальные инструкции, данные агентам, не оказывали влияния на вероятность продажи или согласованные цены.