企業對良好數據質量的需求日益增長,人們需要了解如何獲得良好的數據質量以及它如何影響決策。
搜索引擎上有關“數據質量”這一術語多達600萬項,這清楚地表達了數據質量的重要性及其在決策場景中的關鍵作用。了解數據有助于對其進行分類和鑒定,以便在所需場景中有效使用。
了解數據質量
高質量的數據是準確、一致、可擴展的。數據還應該有助于決策、運營和規劃。另一方面,糟糕的數據質量會導致新系統部署延遲、聲譽受損、生產力低下、決策失誤以及收入損失。根據Data Warehousing研究所發布的一份報告,質量較差的客戶數據每年給美國企業造成大約6110億美元的損失。研究還發現,40%的企業由于數據質量不足而遭受損失。
全球各地的企業都在大量投資于數據管理和處理以獲取高質量的數據,但真正的問題在于定義數量質量是什么。在任何情況下,大多數都引用了幾個共同表征數據質量的屬性。
定義數據質量的七個特征
?準確性:數據是否準確地代表了真實世界的對象?
?完整性:數據在更新之間是否保持完整和未損壞?
?一致性:跨系統存儲的信息是否一致?
?完整性:數據的全面性如何?
?有效性:信息是否符合企業定義的特定格式或范圍?
?及時性:信息是最新的嗎?它可以用于決策嗎?
?可訪問性:數據是否易于訪問、理解和使用?
有幾個要素決定了數據質量,每個企業都會根據自己的需求對功能進行優先級排序。根據階段和增長甚至當前的商業周期,這可能因行業而異。但關鍵是在評估數據時定義關鍵要素。這些特征定義了數據的質量和準確性。因此,它可以幫助企業更好地定位,以便有效地使用這些數據并實現其業務目標。
確保更好的數據質量的方法
(1)認識到數據質量的重要性:數據的主要目的是推動業務發展。與其讓IT部門控制數據質量,不如讓企業更好地配備主要用戶來定義有質量數據的參數。如果商業智能與底層數據密切相關,則更有可能采用有效的方法來幫助企業優先選擇關鍵數據。
(2)避免單一思維:并非所有類型的數據都具有相同的準確性。對于數據質量,并沒有“一刀切”的政策。大量的數據來自不同的來源,因此并非所有形式的數據都具有相同的質量或相同的指標。例如:在對社交媒體數據進行情感分析時,達到80%的準確度就足夠了,而對于銀行和金融服務業等行業來說顯然不夠。因此,在分析之前需要對數據進行處理。
(3)關注數據旅程的每個階段:每個企業都希望通過采用企業級數據戰略的整體方法實現數據驅動。此外,他們還希望優化技術投資并降低成本。在這種情況下,企業應將數據視為一種獲取具有價值見解的資產。
(4)避免不必要的數據:企業每天都在各種操作中捕獲和使用數據。他們擁有的數據越多,錯誤的可能性就越大。企業需要接受數據并不總是完美的現實,了解這一點將使企業快速發現問題并獲得更大的成功。
(5)承擔責任:不同企業的數據因其規模、業務模式、財務狀況和數據戰略而異。企業中的每個人都要為數據質量差負責。這是一個業務問題,不能僅由IT部門負責。通過控制數據質量,企業可以提高效率、降低成本,并改進決策。
(6)使用數據管道設計避免重復數據:重復數據可以是從同一數據源創建的全部或部分數據。人為錯誤會導致大多數數據重復。這會導致報告不準確,生產力下降,營銷預算浪費。需要在企業級別創建清晰、邏輯的數據管道并在整個組織中共享以避免重復。
(7)實施數據治理策略:提高數據質量的最有效方法是定義數據的人員、內容、方式、時間、地點和原因。確保企業中的每個人都遵守這些政策也很重要。這些政策應該通過清楚地記錄它們來執行,以便員工可以訪問它們。這不僅可以提高安全性和合規性,還有助于提高業務績效。
(8)投資內部培訓:這可能是一種變革性的方法。獲得良好的數據質量需要專業知識和經驗,這對于入門級高管來說是難以實現的。這可以通過培訓來實現。為了獲得競爭優勢,培訓團隊、正確管理數據、認識到其內在價值并鼓勵團隊和高管學習基本概念、原則和質量管理實踐至關重要。這有助于了解高質量數據的好處以及由于數據質量不足而產生的成本。
結論
根據調研機構畢馬威公司進行的一項研究,84%的首席執行官擔心他們在決策時所依賴的數據質量。由于首席執行官是企業的主要決策者,因此確保數據質量方面的信任和透明度至關重要。這將使企業能夠節省時間、降低成本、做出明智的決策,并實現準確的分析以提高業務績效。
本文摘自:企業網D1Net