Компания признала, что этот тест, названный Project Deal, был лишь "пилотным экспериментом с самовыбранной группой участников", состоящей из 69 сотрудников Anthropic. Им был выделен бюджет в размере $100, который выплачивался через подарочные карты, для покупки товаров у своих коллег. Тем не менее, Anthropic отметила, что была "поражена тем, насколько хорошо сработал Project Deal", в рамках которого было заключено 186 сделок на общую сумму более $4000. Компания провела четыре отдельных рынка с различными моделями — один из них был "реальным" (где все участники представлялись самой продвинутой моделью компании, и сделки действительно исполнялись после эксперимента), а три других использовались для изучения.

Согласно данным Anthropic, когда пользователи представлены более продвинутыми моделями, они получают "объективно лучшие результаты". Однако пользователи, похоже, не замечали этой разницы, что поднимает вопрос о возможных "разрывах в качестве агентов", когда "люди на проигрывающей стороне могут не осознавать, что находятся в худшем положении". Также было отмечено, что первоначальные инструкции, данные агентам, не оказывали влияния на вероятность продажи или согласованные цены.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *