CIO們面臨著提供預測分析并用智能體改造員工隊伍的壓力,然而,對數據治理、數據運營和數據安全的投資——這些一直以來都非常重要的領域——卻常常因業務驅動的舉措而被忽視,導致如今AI的成功前景變得不確定。
為了彌補這一差距,并確保數據供應鏈得到足夠的高層關注,CIO們已經聘請或與首席數據官(CDO)合作,委托他們解決數據債務問題、自動化數據管道,并轉型為專注于健康指標、數據質量和數據模型互操作性的主動數據治理模式。
但是,CIO們在委托過多數據治理責任或僅從旁觀者角度觀察數據運營改進時必須謹慎,那些重新思考數字化轉型戰略并希望從AI投資中交付業務價值的CIO們,需要更加關注那些可能破壞這些目標的數據風險,一種方法是向IT主管詢問數據管理實踐,以感知哪些領域需要更多的領導關注。
我之前曾寫過關于CIO們應該極度擔憂的IT風險和錯過的GenAI機會的文章。以下是CIO們應該審查并確保其團隊有補救策略的六個數據風險,這些策略最好能將危險轉化為戰略機遇。
誤分類數據和缺乏參與的數據所有者
詢問任何數據治理領導者關于他們在提高數據質量和遵守法規方面所面臨的主要挑戰時,識別并吸引數據所有者參與制定和遵守數據政策幾乎總是名列前茅。沒有積極參與的數據所有者,數據可能未被分類并在AI中被使用,從而可能違反數據隱私規則和其他法規。
在AI時代,未分類數據帶來了第二個挑戰:數據科學家是否應在沒有所需合規性的情況下將這些未分類數據集用于AI模型,還是數據治理應阻止任何人使用這些數據?
“企業必須對其內容進行分類,以便安全基礎設施的各個組件能夠采取適當的行動,”Netwoven的首席執行官Niraj Tenany表示,“手動分類耗時費力,而自動分類則存在顯著的誤報率,因此適當的平衡是成功的關鍵。”
參與數據治理倡議的CIO們往往更能有效地說服部門負責人指派數據所有者,對于公民數據科學能力和渴望獲得AI業務優勢的需求如此之大,以至于領導者們很難拒絕承擔責任,此外,一旦這些數據所有者參與進來,就有更多機會讓他們參與AI治理并合作試點智能體。
暴露給AI的知識產權
許多CIO擔心“影子AI”,即員工使用未被批準的公共大型語言模型(LLM)和其他GenAI工具進行實驗,與AI工具共享誤分類數據和暴露知識產權是CIO們應該極度擔憂的風險。
一個擔憂是員工在AI提示中使用數據、代碼、品牌指南、合同和敏感文檔的部分內容,另一個是數據科學家在未經所需批準和保障措施的情況下,將知識產權納入AI模型,包括為LLM設計的檢索增強生成(RAG)和用于智能體的數據。
“數據是公司擁有的最有價值資產之一,必須像保護其他資產一樣保護它,”Rimini Street的全球CIO Joe Locandro表示,“CIO們應該警惕員工對數據的處理不當、AI工具的誤用以及不良的網絡衛生習慣,優先進行員工教育、在核心系統中實施數據掩碼以及定期進行數據安全審計是保護敏感信息的必要步驟。”
The Modern Data Company的首席執行官Srujan Akula補充說:“營銷團隊未經通知就采用ChatGPT,數據科學家用他們能找到的任何信息構建模型,突然間敏感的客戶數據可能就被輸入到了公共AI工具中,這給CIO們帶來了數據泄露和合規問題等風險,這些問題可以通過清晰、實用的政策和安全的內部替代方案來解決。”
為了降低風險,Akula建議CIO們從經過整理、可信的數據集中創建數據產品,并明確所有權和治理。
CIO們還可以通過贊助數據素養計劃和促進開放創新(任何員工都可以提交想法)將這種風險轉化為優勢,這些計劃的結合鼓勵了學習和問題解決,同時企業也能從一線員工那里獲得更多倡議的可見性。
第三方數據源
美國企業預計在2025年將在營銷數據上花費261億美元,這些數據通常用于客戶細分、個性化營銷活動和改進歸因分析。
盡管確保內部數據實踐符合法規要求和數據治理政策已經夠難了,但跟蹤第三方數據源的合規性則更具挑戰性。
“一個最常被忽視的風險是依賴第三方數據管道或豐富服務,而沒有驗證他們如何獲取數據,”SOAX的產品負責人Luis Lacambra表示,“如果這些數據是通過不可靠或不符合規定的方法從公共來源抓取或聚合的,你的企業可能會面臨監管審查或運營盲點。”
審查第三方數據合規性應成為由CDO管理的、不可協商的數據治理要求。
CIO們還可以采取另一種方法來應對第三方數據風險,公司采購并集成了許多未被充分利用、與其他數據源提供重復信息或提供邊際業務價值的來源,尋求成本降低機會的CIO們應該對第三方數據源進行成本效益審計,審查利用率并量化風險,機會在于通過消除低價值、高風險的來源來降低成本。
數據管道可觀測性差
大多數企業會在投資于強大的數據集成和管道之前,先投資于終端用戶分析工具,如數據分析平臺和文檔處理工具。隨著各部門越來越依賴實時數據進行決策,數據管道的可靠性和性能可能成為一個運營噩夢,特別是當數據管理員必須定期修復數據問題或數據滯后導致決策失誤時。
“CIO們必須敏銳地意識到威脅企業完整性、安全性和決策有效性的數據相關風險,”RecordPoint的首席技術官Josh Mason表示,“一個關鍵領域是對數據管道和使用模式缺乏足夠的可觀測性,其中不足的可觀測性可能隱藏潛在問題,如延遲、數據漂移、管道故障以及敏感數據的位置。”
數據運營(DataOps)中的可觀測性包括監控數據管道、自動化響應和跟蹤性能,DataOps指標包括管道可靠性、自動化率、異常率和處理吞吐量。
對于集成許多數據源并使用數據結構來集中訪問的CIO們來說,減少DataOps事件可以節省成本,但更重要的驅動力是,不可靠的數據集成會侵蝕信任,而這可能會減緩部門領導者對更多AI和數據驅動實踐的投資。
數據質量差距
CIO們一直在努力通過指派數據管理員、自動化數據清理程序和衡量數據健康狀況來提高數據質量,但是,大部分工作都集中在ERP、CRM和數據倉庫中的結構化數據源上。AI擴大了這項工作的范圍,因為RAG和智能體利用非結構化數據源和文檔存儲庫來訓練模型并提供上下文相關的響應。
“RAG為企業提供了訪問企業知識的途徑,但并非沒有風險,包括數據隱私漏洞、幻覺和集成挑戰,”Pryon的首席執行官Chris Mahl表示,“實施需要投資于數據質量、建立治理框架和創建評估系統,然后再進行擴展。從RAG中獲得真正價值的企業不僅訪問信息更快——他們還通過找到創新與保障之間的正確平衡來做出更好的決策。”
為了解決數據質量差距,CIO們應考慮將原始數據集中存儲在數據湖中,提供數據清理作為共享服務,并通過數據結構和客戶數據平臺啟用訪問。由于存在許多數據質量和管理工具,開發一個專注于數據質量的共享服務是解決企業對清潔AI數據源的更大業務需求和擴大非結構化數據源清理范圍的有效方法。
過度依賴AI輸出而缺乏嚴格的質量保證
定義AI治理的七個問題包括關于業務價值、工具選擇、合規性和數據治理的問題,但最重要也是今天最具挑戰性的一個問題是:員工應如何驗證和質疑LLM的響應或智能體的建議?
對于希望開發智能體的CIO們來說,這個問題更為重要,因為測試LLM的質量保證實踐仍在發展中,并且往往依賴于手動測試。
“CIO們必須持續監控AI生成輸出的準確性和可靠性,”Pendo的首席產品官Trisha Price表示,“因為AI系統不是確定性的,定義質量變得更加復雜,工程、質量保證和產品之間的界限變得模糊,這種轉變要求團隊之間更緊密的合作,以確保AI驅動的體驗是可信的、符合用戶需求的,并能夠推動真正的業務成果。”
CIO們歷來難以證明對質量保證(QA)的投資是合理的,因為向業務部門推銷增加開發人員或提高運營和安全彈性更容易,但是,隨著更多軟件開發者使用AI代碼生成器且IT運營變得更加自動化,CIO們可能會發現更大的需求和預算機會來投資于QA和AI測試能力。
對于CIO們來說,對風險、尤其是圍繞知識產權和新興AI能力的風險保持一定程度的擔憂是健康且重要的。最優秀的CIO們不僅會制定緩解計劃,還會尋求將風險轉化為戰略機遇的選項。
企業網D1net(m.hfnxjk.com):
國內頭部to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。