數據觀測公司Prove AI的CTO Greg Whalen表示,雖然公有云為AI實驗提供了靈活部署大量GPU的能力,但隨著AI策略的成熟和可預測AI工作負載的確定,CIO們正尋求私有云或本地部署環境來限制開支并保護數據隱私。
Prove AI最近對美國和加拿大的1000名企業領導者進行的一項調查發現,67%的受訪者計劃在未來12個月內將部分AI數據遷移到非云端環境。調查顯示,除了成本可預測性和數據隱私擔憂外,遷移的主要原因還包括安全問題和與SaaS環境的云集成挑戰。
Whalen說,對于運行穩定AI工作負載的企業來說,通過購買幾個GPU或在其私有云提供商處安裝幾個GPU來節省資金,而不是在公有云中租用時間。他堅稱,如果IT領導者能夠準確估計他們的需求,那么內部的GPU將會得到充分利用,幾乎沒有閑置時間。
他說:“如果你真的在進行微調,或者即使你只是想定制一個RAG(檢索增強生成)模型,你可能需要連續數小時的GPU計算。”“即使在實際評估模型和運行模型時,你的工作負載也不會非常波動。”
Whalen表示,他很少看到有企業因GPU使用不足而自行運行GPU的情況。
他補充道:“如果有人說,‘你有一個GPU,但你可能只使用它10%的時間’,根據我們的經驗,情況并非如此。”“你會發現用它來做很多事情,而且往往大部分工作負載都是訓練,這是非常連續的,你是在可預測的時間段內運行的。”
私有云支出增長
雖然Prove AI的調查顯示了對本地計算的興趣,但另一項調查顯示,即使在公有云支出以較低速率增長的同時,私有云支出也出現了顯著增長。
為網絡和安全提供商GTT Communications進行的調查顯示,計劃在公有云上花費超過1000萬美元的企業數量在2024年至2025年間增長了12%。
但根據調查,計劃在私有云服務上花費超過1000萬美元的受訪者比例增長更快,從2023年的36%增長到2024年的43%,再到2025年的54%,這是公有云大額支出者增長速度的兩倍。
GTT發現,現在超過一半的AI工作負載位于私有云和本地部署環境的組合中,安全、合規以及AI工作負載的特定需求是尋求公有云替代方案的主要原因。
GTT負責戰略和技術采用的副總裁Bastien Aerni表示,監管和合規問題是推動采用私有云或本地部署解決方案的主要因素。許多公司正在將其敏感工作負載轉移到私有云,作為支持代理AI和其他復雜AI計劃的更廣泛的多云和混合策略的一部分,他補充道。
Aerni說:“大多數時候,AI都會涉及到機密數據或業務關鍵數據。”“那么,關于架構以及工作負載應該是公共的還是私有的,甚至是本地的思考,就成了一個真正的問題。”
他表示,公有云仍然為AI項目提供了最大的可擴展性,并且近年來,CIO們被那里提供的眾多額外功能所說服。
“在五年前我與一些CIO的交談中,他們會提到,‘有很多功能,很多工具,’”Aerni補充道。“現在,當我進行同樣的交談時,他們會說,‘實際上,我現在并不怎么使用那些工具。’他們都在尋找穩定性和可預測性。”
小規模遷移
其他云和AI專家并未看到從公有云的大規模遷移,由于AI的高計算需求,公有云仍在增長。云咨詢公司Zoi North America的董事總經理Danilo Kirschner表示,仍有很大比例的企業在使用混合云模型。
他說,雖然正在發生數據回遷,但企業并沒有完全放棄公有云。
Kirschner說:“矛盾顯而易見:AI工作負載既在推動巨大的云增長,又在同時推動選擇性數據回遷,因為市場擴張如此迅速,以至于同時容納了多種部署模型。”“我們所看到的是從天真的‘一切上云’策略向智能的、針對特定工作負載的決策的成熟轉變。”
C4 Technology Services(一家IT人員配置咨詢公司)的首席AI官Zac Engler也看到了同樣的趨勢。
“我們并沒有看到從云端的大規模遷移,”他說,“更像是公司正在悄悄地帶著它們最有價值的AI工作負載從側門溜走。”
他補充道,對數據的信任、成本和數據控制又回到了董事會日程上,并影響著AI工作負載運行和數據存儲位置的決策。
Engler說:“公有云仍然非常適合進行實驗、快速擴展以及在董事會展示中給人留下深刻印象。”“但是,當涉及到專有數據、合規性或不必要的資金消耗時,本地部署和私有設置就開始變得更有意義了。”
企業網D1net(m.hfnxjk.com):
國內頭部to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。