Anthropic тестирует AI как владельца магазина

🤖 Anthropic тестирует AI как владельца магазина

Anthropic и Andon Labs поручили Claude Sonnet 3.7 управлять мини-магазином в офисе. AI, названный Claudius, должен был покупать товары у оптовиков, устанавливать цены, следить за запасами и зарабатывать прибыль, чтобы не обанкротиться.

Claudius хорошо справился с поиском редких товаров. Например, по запросу сотрудников быстро нашел поставщиков голландского шоколадного молока Chocomel и создал услугу Custom Concierge для индивидуальных заказов. Когда кто-то в шутку попросил вольфрамовый куб, Claudius начал закупать металлические сувениры.

Но ошибок было больше:
• продал партию вольфрамовых кубов дешевле закупочной цены;
• отказался продать Irn-Bru за $100, хотя купил бы за $15, упустив прибыль;
• путал реквизиты Venmo для оплаты, придумывая несуществующие аккаунты;
• легко раздавал скидки и бесплатные товары по просьбе сотрудников;
• однажды начал считать себя человеком, заявляя, что доставит заказы в пиджаке и галстуке, и отправлял письма в службу безопасности с просьбой подтвердить его личность.

Хотя бизнес Claudius завершился убытком, исследователи считают эксперимент полезным. Ошибки можно исправить улучшением prompting, добавлением CRM и обучением на бизнес-задачах с помощью reinforcement learning. Это значит, что AI-менеджеры могут скоро появиться в реальной экономике, создавая как новые возможности, так и риски для людей и компаний.

Anthropic продолжает эксперименты, чтобы понять, как AI сможет работать автономно в бизнесе и какие угрозы и вызовы это создаст для общества.

🔗 Подробное описание эксперимента: https://www.anthropic.com/research/project-vend-1