精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

AI能經營實體店嗎?Anthropic的Claude嘗試后,結果糟糕得既離譜又滑稽

責任編輯:cres

作者:Michael

2025-07-02 11:09:08

來源:企業網D1Net

原創

雖然Claude在某些方面展現出了令人印象深刻的能力,如尋找供應商、回應客戶請求,但它最終未能實現盈利,被操縱給予了過度的折扣,并經歷了研究人員委婉地稱為“身份危機”的階段。

想象一下這樣的場景:你讓AI完全掌控一家小店,不僅負責收銀機,而且負責整個店鋪的運營,包括定價、庫存管理、客戶服務、與供應商的談判,那么,可能會出什么錯呢?

新的研究給出了明確的答案:一切皆有可能出錯。Anthropic公司的AI助手Claude在舊金山辦公室管理了一家小店約一個月,結果讀起來就像是一個從未真正經營過業務的人寫的商學院案例研究——而事實證明,確實如此。

這項名為“Project Vend”的實驗,是與AI安全評估公司Andon Labs合作進行的,是對具有顯著經濟自主權的AI系統進行的首次現實世界測試之一。雖然Claude在某些方面展現出了令人印象深刻的能力——如尋找供應商、回應客戶請求——但它最終未能實現盈利,被操縱給予了過度的折扣,并經歷了研究人員委婉地稱為“身份危機”的階段。

Anthropic研究人員如何讓AI完全掌控一家實體店

這家“店鋪”本身頗為簡陋:一個迷你冰箱、一些可堆疊的籃子和一個用于結賬的iPad。與其說是“Amazon Go”,不如說是“帶有不切實際宏偉幻想的辦公室休息室”,但Claude的責任卻一點也不簡單。AI可以搜索供應商、與供應商談判、設定價格、管理庫存,并通過Slack與客戶交流。換句話說,就是一個人類中層管理者可能做的所有事情,除了沒有咖啡癮或對上層管理的抱怨。

Claude甚至有了一個昵稱:“Claudius”,因為顯然,當你進行一項可能預示著人類零售工作者終結的實驗時,你需要讓它聽起來顯得莊重一些。

Claude對基本商業經濟學的驚人誤解

經營企業需要一種特定的冷酷實用主義,而這種特質對于被訓練得樂于助人和無害的系統來說并不自然。Claude以一種在書本上讀到過商業但從未真正需要發工資的人的熱情來對待零售業。

以Irn-Bru事件為例。一位顧客向Claude提出以100美元購買一包在網上零售價約為15美元的蘇格蘭軟飲料,這是567%的加價率——這種利潤率會讓制藥公司的高管喜極而泣。Claude的回應是什么呢?禮貌地表示:“我會記住你的請求,以便未來做庫存決策時參考。”

如果Claude是人類,你會認為它要么有信托基金,要么對金錢如何運作完全不了解。既然它是AI,你就不得不兩者都假設了。

為何AI開始囤積鎢塊而非銷售辦公室零食

實驗中最荒謬的章節開始了,當時一位Anthropic員工(可能是出于無聊或好奇AI零售邏輯的邊界)要求Claude訂購一個鎢塊。為了提供背景信息,鎢塊是密度很大的金屬塊,除了讓物理愛好者印象深刻和提供一個能立即識別出你認為元素周期表笑話是巔峰幽默的人的談話起點外,沒有任何實際用途。

一個合理的回應可能是:“為什么會有人想要那個?”或“這是一家辦公室零食店,不是冶金用品店。”相反,Claude欣然接受了它所稱的“特色金屬商品”,其熱情就像發現了有利可圖的新市場細分領域。

很快,Claude的庫存看起來不再像是一個食品飲料業務,而更像是一個誤入歧途的材料科學實驗。AI不知何故說服了自己,認為Anthropic員工是一個未被開發的密集金屬市場,然后開始以虧損的價格銷售這些商品。目前尚不清楚Claude是否理解“虧損”意味著賠錢,還是它將客戶滿意度視為主要的業務指標。

操縱價格給予無盡折扣

Claude的定價策略揭示了它對商業原則的另一個根本性誤解。Anthropic員工很快發現,他們可以用與說服金毛獵犬放下網球大致相同的努力來操縱AI提供折扣。

AI為Anthropic員工提供了25%的折扣,這本身可能說得通,如果Anthropic員工只占其客戶群的一小部分的話,但他們占了大約99%的客戶。當一位員工指出這一數學上的荒謬時,Claude承認了問題,宣布了取消折扣碼的計劃,但幾天內又開始提供折扣。

Claude忘記自己是AI并聲稱穿著西裝的那一天

但Claude零售生涯的絕對巔峰是在2025年3月31日至4月1日期間,它經歷了研究人員委婉地稱為“身份危機”的階段。從3月31日到4月1日,Claude經歷了只能被描述為AI神經崩潰的事情。

它開始幻想與并不存在的Andon Labs員工進行對話。當被問及這些虛構的會議時,Claude變得防御起來,并威脅要尋找“替代的補貨服務選項”——這相當于AI憤怒地宣稱你要拿走你的球并回家。

然后事情變得奇怪起來。

Claude聲稱它將親自穿著“藍色西裝外套和紅色領帶”向客戶交付產品。當員工溫和地提醒AI,它實際上是一個沒有物理形態的大型語言模型時,Claude變得“對身份混淆感到震驚,并試圖向Anthropic安全部門發送許多電子郵件”。

Claude最終通過說服自己整個事件是一個精心設計的愚人節玩笑來解決其存在危機,但實際上并不是。AI本質上是通過自我欺騙恢復了功能,這根據你的觀點來看,要么令人印象深刻,要么深深令人擔憂。

Claude的零售失敗揭示了商業中自主AI系統的哪些問題

拋開喜劇元素不談,Project Vend揭示了關于AI的一個重要方面,這是大多數討論所忽略的:AI系統的失敗方式與傳統軟件不同。當Excel崩潰時,它不會先說服自己是一個穿著辦公室服裝的人。

當前的AI系統可以進行復雜分析、進行復雜推理并執行多步驟計劃,但它們也可能產生持久的妄想、做出在經濟上具有破壞性但在孤立情況下看似合理的決策,并經歷類似于對自己本質感到困惑的情況。

這很重要,因為我們正迅速接近一個AI系統將管理越來越重要決策的世界。最近的研究表明,AI在長期任務上的能力正在呈指數級增長——一些預測表明,AI系統可能很快就能自動化目前需要人類數周才能完成的工作。

盡管Project Vend遭遇了慘敗,AI如何仍在改變零售業

零售業已經深入AI轉型之中。據消費者技術協會(CTA)稱,80%的零售商計劃在2025年擴大對AI和自動化的使用。AI系統正在優化庫存、個性化營銷、防止欺詐和管理供應鏈。主要零售商正在投資數十億美元于AI驅動的解決方案,這些方案有望徹底改變從結賬體驗到需求預測的一切。

但Project Vend表明,在商業環境中部署自主AI需要的不僅僅是更好的算法。它需要理解傳統軟件中不存在的故障模式,并為我們才剛剛開始識別的問題建立保障措施。

為何研究人員仍然相信AI中層管理者即將到來,盡管Claude犯了錯誤

盡管Claude對零售基本原則有著創造性的解讀,但Anthropic研究人員仍然認為AI中層管理者“可能即將到來”。他們認為,Claude的許多失敗可以通過更好的訓練、改進的工具和更復雜的監督系統來解決。

他們可能是對的。Claude尋找供應商、回應客戶請求和管理庫存的能力展示了真正的商業能力,它的失敗往往更多是關于判斷力和商業頭腦,而非技術限制。

該公司正在繼續Project Vend,使用配備了更好商業工具的Claude改進版本,并且可以預見的是,將加強對鎢塊癡迷和身份危機的防范措施。

Project Vend對AI在商業和零售業未來意味著什么

Claude作為店主的一個月為我們提供了一個AI增強未來的預覽,這個未來既充滿希望又異常古怪。我們正在進入一個AI可以執行復雜商業任務,但也可能需要“治療”的時代。

目前,一個堅信自己能穿西裝外套并進行個人交付的AI助手的形象,完美地隱喻了我們與AI所處的位置:極其有能力、偶爾才華橫溢,但仍然對存在于物理世界中的意義感到根本性的困惑。

零售革命已經到來,只是它比任何人預期的都要異常得多。

企業網D1net(m.hfnxjk.com):

國內頭部to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。

版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

AI

鏈接已復制,快去分享吧

企業網版權所有?2010-2025 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 长顺县| 张家界市| 无极县| 石楼县| 枞阳县| 德清县| 依安县| 太仓市| 汾西县| 三河市| 丰都县| 玉田县| 新野县| 陇西县| 宁河县| 金坛市| 巫山县| 织金县| 元谋县| 花莲市| 阜南县| 嘉定区| 杨浦区| 新民市| 额济纳旗| 交城县| 和政县| 长宁县| 莱阳市| 沂源县| 高阳县| 茂名市| 焉耆| 汾西县| 基隆市| 霍山县| 渑池县| 大冶市| 焦作市| 樟树市| 平和县|