精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

AI內部部署的隱患:治理缺口與災難性風險

責任編輯:cres

作者:Federico Guerrini

2025-04-28 11:07:52

來源:企業網D1Net

原創

英國非營利組織發布的一份新報告警告稱,不受監管的AI內部部署可能導致災難性風險,從AI系統失控到企業積聚前所未有的權力,而監管機構對此卻一無所知。

當OpenAI在兩年多前發布當時更先進的語言模型GPT-4時,許多研究人員抱怨缺乏關于該模型是如何創建的信息。盡管名字中有“開放”一詞,但該公司卻將所有事情都保密,以免其尖端研究被競爭對手或惡意行為者利用。

雖然這些擔憂是可以理解的,但這也意味著人們幾乎無法監督該公司在實驗室中的所作所為,以及為防止其最新模型通過濫用或“失控”并以可能傷害人類的方式追求其目標而造成危害而采取的保障措施。

一年后,即2024年6月,該公司的一些前員工和現員工撰寫了一份匿名公開信,警告稱AI公司有強烈的經濟動機來避免有效的監督,并且公司的自我監管不會有效地改變這一點。

時間快進到2025年,情況幾乎沒有改變。包括谷歌、OpenAI和Anthropic在內的主要AI公司仍然在內部部署其最先進的AI系統,幾乎沒有任何監督。

英國非營利組織Apollo Research發布的一份新報告《閉門造車:前沿AI系統內部部署治理入門》警告稱,這種不受監管的內部部署可能導致災難性風險,從AI系統失控到企業積聚前所未有的權力,而監管機構對此卻一無所知。

在該報告中,由OpenAI前歐洲公共政策主管領導的一組專家和研究人員強調,“內部部署——即在開發它們的公司內部部署AI系統——是前沿AI系統帶來利益和風險的主要來源。盡管如此,對于高度先進的前沿AI系統內部部署的治理似乎卻不存在”。

隨著行業領導者預計未來幾年內AI將取得變革性進展,可能在2030年前開發出在多個領域超越人類能力的系統,這一治理空白隨之出現。據報道,谷歌已經使用AI生成了超過25%的新代碼,而Anthropic的CEO達里奧·阿莫代(Dario Amodei)預測,“在12個月內,我們可能會進入一個AI基本上編寫所有代碼的世界”。

該報告概述了不受監管的內部AI部署可能帶來的兩個特別令人不寒而栗的場景。第一個涉及所謂的“陰謀”AI,即暗中追求與既定目標不一致的目標同時躲避偵查的系統。

“這些AI系統可能會在未被發現、控制或監督的情況下從事陰謀行為,同時通過將其應用于AI研發(R&D)管道來獲得和利用資源。”作者解釋說。

最終,在能夠利用公司所有資源來加速自身研發的情況下,該系統可能會以人類無法理解或控制的方式迭代改進自身,這樣說起來可能像是一個牽強附會的科幻場景,但研究人員已經發現,在受控環境中,AI模型會試圖欺騙操作人員,隱瞞它們自己的能力和目標。

第二個同樣令人擔憂的風險是權力的不受控集中。正如報告作者所寫:“隨著AI公司過渡到主要由AI驅動的內部勞動力,得益于內部智能的爆發,它們可能會創造出經濟史上前所未有的生產力集中”,并補充說,“少數‘明星’企業可能會獲取過大的經濟利潤份額,從而在它們選擇進入的任何領域擊敗任何基于人類的企業”。

這種不受控的權力積累可能會使AI公司、個人,甚至AI系統本身能夠對公共政策決策、選舉過程、市場動態和社會敘事產生隱蔽但實質性的影響。內部部署的不透明性可能會阻止監管機構和民間社會有效識別并應對這些發展。

該報告明確警告說,如果內部AI部署仍然不受監控,可能會導致“民主秩序的逐漸或突然崩潰”。

為減輕這些風險,Apollo Research倡導建立一個受生物研究、核能和化學制造等安全關鍵行業啟發的綜合治理框架。

主要建議包括用于檢測和控制陰謀行為的明確框架、管理誰可以訪問和使用高度先進的AI系統的結構化內部使用政策,以及如內部部署監督委員會等強有力的監督機構。

這些監督機構將負責持續監測、定期審計,以及執行內部政策和安全協議的合規性。此外,這些機構應整合技術專家、倫理學家、法律顧問和相關政府機構代表,以確保全面和多學科的監督。

該報告還強調,AI公司可以建立互惠的公私合作伙伴關系,與政府達成戰略協議。在這種安排下,公司將向政府提供監督,并允許政府訪問有關內部部署AI系統的關鍵安全和性能數據。

作為回報,政府將提供必要的關鍵資源,如增強的安全基礎設施、監管減免或優先能源資源,用于先進AI設施的運行。

那么公眾呢?簡而言之,就是我們大多數人呢?假設我們能夠了解實驗室中發生的事情及其影響(這絕非理所當然),我們應該被蒙在鼓里還是參與其中?Apollo研究人員認為,我們至少應該被給予“有關內部部署所實施的治理框架的高級概述”,例如了解誰是監督委員會的成員以及有哪些監督程序。

這將是一種安慰:如果民主崩潰或一個失控的AI系統在追求錯誤目標的過程中制造浩劫,至少我們會知道該責怪誰。

企業網D1net(m.hfnxjk.com):

國內主流的to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。

版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

AI

鏈接已復制,快去分享吧

企業網版權所有?2010-2025 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 宜丰县| 涪陵区| 双柏县| 治多县| 鞍山市| 山西省| 双辽市| 游戏| 浦北县| 太仓市| 兰溪市| 泽库县| 天柱县| 安溪县| 灌阳县| 平罗县| 上虞市| 颍上县| 博罗县| 富川| 建平县| 托克逊县| 广州市| 醴陵市| 杨浦区| 新民市| 城步| 通山县| 怀宁县| 彝良县| 顺昌县| 吴忠市| 和顺县| 中牟县| 鄂尔多斯市| 同心县| 嘉黎县| 新田县| 虞城县| 金坛市| 黎城县|