

AI 解決方案
為 AI 提供高品質資料的 IT 領導者指南
IT 領導者知道,組織資料的品質將決定 AI 解決方案的成效,因為資料工程師就是如此告訴他們。
然而,同一群資料工程師也經常喟嘆組織缺乏可靠的資料,並為培養資料所需的工作而煩惱。這些團隊與公司主管都承受著同樣的壓力。
根據 The Futurum Group and Kearney 的研究,近三分之二的執行長認為,孤立的基礎結構和分散的技術堆疊造成的低品質或斷線資料,是阻止 AI 解決方案擴充的主要障礙。
在探索如何培養高品質資料以服務 AI 解決方案之前,必須瞭解品質不佳的資料會帶來什麼潛在後果。
垃圾進垃圾出的現實
垃圾進,垃圾出。隨著生成式 AI 興起,這句話已成為主流。當 AI 模型中包含的資料不準確或不客觀 (垃圾進),模型就無法歸納結果,導致預測或決策錯誤 (垃圾出)。
但是這在實務上是什麼樣子?當您將低品質資料輸入 AI 系統,實際上是在要求 AI 根據毀損的資訊做出價值數百萬美元的決策。
想像有一家連鎖零售商店部署了 AI 系統,來最佳化 500 家商店的庫存。現在假設連鎖店的銷售資料未正確標記商品退貨,導致商品顯示為額外銷售。
結果,AI 系統錯誤地假設某些產品的銷售量增加 30%。最後的結果就是,大量超購滯銷商品,數百萬的庫存過剩和存貨短缺。
或者,假設有一家大型銀行的 AI 聊天機器人,訓練時使用的客戶服務紀錄稿充滿保存不善、不準確的資料,其中專員將支票帳戶資料縮寫為術語「chk」、「支票」或甚至數字帳戶代碼。
很可惜,聊天機器人無法可靠地理解客戶的基本銀行服務要求,因此降低了客戶滿意度。銀行往往必須僱用更多的人工專員來處理其他要求。
想像一下,如果類似的場景在其他受監管的產業中上演,需要在法規遵循和風險之間取得微妙平衡。有時結果會造成聲譽和財務損失;這是劣質資料輸出的嚴重情況。
打造高品質資料
Dell Technologies 和 NVIDIA 撰寫了這本電子書,說明組織如何制定資料策略,以確保成功部署 AI。對於推動有影響力的資料策略,其中的關鍵層面之一是準備資料。
高品質資料會決定 AI 模型的感知、預測和行動能力,這些都是關鍵的效能標準。沒有健全的資料,AI 基礎就會崩潰。本文將介紹保持資料庫整潔的必要步驟。
- 稽核資料:在能夠將資料變成您偏好的未來狀態之前,必須評估其當下的狀態。您的資料管理堆疊是否乾淨、井井有條且維護良好?執行這些步驟有助於偵測和修正錯誤、重複或不一致的地方。
- 結合資料孤島。組織資料分散在各個營業範圍的應用程式和平台中。整合資料來源後,您就能更準確地查看資料、減少重複,並獲得更值得做為行動依據的見解。
- 準備資料。隨著時間推移,資料會變得過時且龐雜;此時清理、標記和標準化資料可提升 AI 模型效能,並縮短部署時間。建立資料結構、一致性和完整性的組織標準,有助於確保業務所依賴的模型能夠從正確的信號中學習。
- 落實治理與法規遵循。資料安全性和復原能力十分重要。建立清晰的資料譜系、安全控管措施和法規遵循框架,可培養對 AI 系統的信任。維持強大的資料治理結構和稽核追蹤,可確保負責任地使用敏感資料,同時符合法規。
- 現代化資料基礎結構。AI 解決方案需要現代化的運算、儲存及網路技術,以及設定和支援這些技術的專業知識。升級至支援即時存取、擴充能力及整合的平台,滿足貴組織日漸增加的 AI 需求。
邁向資料基礎結構現代化
簡化資料的移動、處理及治理方式,確保您的 AI 工作負載可以擴充。統一且靈活的方法可加快上市時間,使貴組織與時俱進。
這種方法難以取得。Dell Technologies 和 NVIDIA 攜手打造 Dell AI Factory with NVIDIA,其中包含多種技術和服務,例如加速使用案例、整合資料和工作流程,以及協助您設計自己的 AI 旅程等。
請謹記:垃圾進,垃圾出。好的資料可以創造競爭優勢,而壞的資料會帶來代價高昂的大規模困境。問題不在於您是否有能力投資資料品質,而是您能否承擔不這麼做的後果。
您承擔得起嗎?
