跳至主要內容

什麼是資料管理?

什麼是資料管理?

資料管理是收集、儲存、保護和使用組織資料的過程。雖然組織目前擁有數個不同的資料來源,但他們必須分析和整合資料,以獲得用於戰略規劃的商業智慧。資料管理包括在法律和法規範圍內提高資料可用性的所有政策、工具和程序。

為什麼資料管理很重要?

資料被認為是現代組織的寶貴資源。由於可以存取大量和不同的資料類型,組織會在資料儲存和管理基礎設施方面進行大量投資。他們使用資料管理系統更有效率地執行商業智慧和資料分析操作。下面我們將介紹資料管理的一些好處。

增加收入和利潤

資料分析可以更深入地了解業務的各個方面。您可以根據這些見解採取行動,以最佳化業務營運並降低成本。數據分析還可以預測決策的未來影響,改善決策和業務規劃。因此,組織透過改進其資料管理技術可獲得顯著的收入增長和利潤。

減少資料不一致性

資料孤島是組織內只有一個部門或群組可以存取的原始資料集合。資料孤島會產生不一致性,從而降低資料分析結果的可靠性。資料管理解決方案可整合資料並建立集中式資料檢視,從而改善部門之間的協作。

符合法律合規要求

通用數據保護規例(GDPR)和加州消費者隱私法案(CCPA)等法律旨在保護客戶數據。這些資料保護法例包括要求:

  • 同意擷取資料

  • 嚴格控制數據位置和使用

  • 根據要求安全的數據存儲和刪除

因此,組織需要一個公平、透明和機密的資料管理系統,以保護資料,同時保持準確性。

資料管理的重點領域有哪些?

資料管理的實踐涵蓋高品質資料的收集和分發,除了資料治理外,以控制資料存取。

資料管控包括組織為管理資料安全性、完整性和負責任的資料公用程式而實作的政策和程序。它定義資料管理策略並確定誰可以存取哪些資料。資料管控政策還確立了團隊和個人存取及使用資料時的責任。資料管控功能通常包括:

資料分析

資料分析是分析資料的診斷過程,以確定其結構、品質和特性。這是了解現有數據集的第一步,以決定它在使用之前是否需要重構。

資料系列

資料系統追蹤整個組織之間的資料流程。時間戳記資料系列用於判斷資料的來源、使用方式以及何時轉換。此資料管理程序在稽核流程中特別重要。

資料型錄

資料目錄是組織的資料資產和相關中繼資料的集合。將所有資料相關資訊儲存在中央目錄中,它會成為組織內的主要資料登錄。使用者可以期望資料目錄包含所有資料資產的最新資訊。

資料安全和存取控制

資料管控可防止未經授權的資料存取,並保護資料免於損毀。它包括所有方面的保護,如下所示:

  • 防止意外移動或刪除資料
  • 保護網路存取以降低網路攻擊的風險
  • 確認儲存資料的實體資料中心符合安全要求
  • 即使員工從個人裝置存取資料,也能確保資料安全
  • 使用者驗證、授權,以及資料存取許可的設定與執行
  • 確保儲存的資料符合儲存資料所在國家/地區的法律
  • 為敏感資料新增額外的控制層

資料合規性

資料合規政策可降低監管罰款或行動的風險。遵守 GDPR 和 CCPA 等合規法對營運至關重要。

合規活動專注於資料建模、軟體控制和員工培訓,以便在所有層面都能遵守法律。例如,組織與外部開發團隊合作以改善其資料系統。在將所有個人資料傳送給外部團隊以用於測試目的之前,資料管控管理者會確認是否已移除這些資料。

資料生命週期管理

資料生命週期管理是指在整個生命週期中管理資料的過程。 

例如:

  • 數據必須在攝入時並定期驗證
  • 資料必須保存在特定時間,以作審核目的
  • 不再需要時,必須刪除數據

資料品質管理

資料的使用者希望資料在每個使用案例中具有足夠的可靠性和一致性。

資料品質管理者可衡量並改善組織的資料品質。他們會檢閱現有資料和新資料,並確認其符合標準。他們也可能會設定資料管理程序,以阻止低品質資料進入系統。資料品質標準通常衡量以下內容:

  • 關鍵信息是否缺少,還是數據完整?(例如,客戶忽略了關鍵聯繫信息)
  • 資料是否符合基本資料檢查規則? (例如,電話號碼應該是一定數字)
  • 相同資料多久出現在系統中?(例如,同一客戶的重複資料項)
  • 資料準確嗎?(例如,客戶輸入錯誤的電子郵件地址)
  • 整個系統的資料品質是否一致?(例如,出生日期在一個資料集中為 dd/mm/yyyy 格式,但在另一個資料集中為 mm/dd/yyyy 格式)

資料整合

資料分佈的端點

對於大多數組織而言,資料必須分佈到 (或附近) 需要該資料的各個端點。這些包括作業系統、資料湖和資料倉儲。由於網路延遲,資料分佈是必要的。當操作使用需要資料時,網路延遲可能不足以及時傳送資料。將資料副本儲存在本機資料庫中,可解決網路延遲問題。

資料分佈對於資料合併也是必要的。資料倉儲和資料湖可合併來自各種來源的資料,以呈現合併後的資訊。資料倉儲用於分析和決策,而資料湖則是一個綜合中樞,可從中擷取資料用於各種使用案例。

資料複寫機制及對一致性的影響

資料分佈機制對資料一致性有潛在影響,這是資料管理中的一個重要考量。

同步複寫資料帶來強大的一致性。在這種方法中,當資料值發生變更時,所有應用程式和使用者都會看到變更後的資料值。如果尚未複製資料的新值,則會封鎖對資料的存取,直到更新所有副本為止。同步複寫使一致性優先於效能和資料存取。同步複寫最常用於財務資料。

非同步資料複寫產生的最終一致性。資料變更時,最終會更新副本 (通常在幾秒鐘內),但不會阻止對過期副本的存取。對於許多使用案例,這不是問題。例如,社交媒體帖子、喜歡和評論不需要強大的一致性。另一個範例是,如果客戶在一個應用程式中變更其電話號碼,則此變更可以非同步串聯。

比較串流與批次更新

資料串流會在資料變更時進行串聯。如果需要訪問近乎即時數據,這是首選的方法。資料變更後,就會擷取、轉換並傳送至其目的地。

如果必須在交付之前分批處理資料,則批次更新更適合。總結或執行資料的統計分析並僅提供結果就是這樣一個範例。如果在特定時間點擷取所有資料,則批次更新也可以保留資料的時間點內部一致性。透過擷取、轉換、載入 (ETL 或 ELT) 程序進行批次更新通常用於資料湖、資料倉儲和分析。

主資料管理

主資料管理 (MDM) 指管理基本業務資料的過程。資料一致性和資料同步都與 MDM 相關。

主資料的範例包括客戶資料、合作夥伴資料和產品資料。這些基本數據主要是持久的,並且不經常更改。使用中的資料範例包括客戶關係管理 (CRM) 和企業資源規劃 (ERP) 軟體。

主資料管理對於確保其跨系統的準確性至關重要,包括同步處理和更新時的資料整合。

有哪些資料管理挑戰?

以下是常見的資料管理挑戰。

規模和效能

組織需要可大規模高效執行的資料管理軟體。他們必須持續監控並重新設定資料管理基礎架構,以維持高峰期間的回應時間,即使資料呈指數級成長。

變更需求

合規性法規非常複雜,而且會隨著時間而變化。同樣,客戶需求和業務需求也會迅速變化。雖然組織在可使用的資料管理平台上有更多選擇,但他們必須持續評估基礎架構決策,以維持最大的 IT 靈活性、法律合規性並降低成本。

員工培訓

在任何組織中開始資料管理程序都具有挑戰性。大量的數據可能會令人難以置信,也可能存在跨部門的孤島。規劃新的資料管理策略,並讓員工接受新的系統和程序需要花費時間和精力。

有哪些資料管理最佳實務?

資料管理最佳做法是成功資料策略的基礎。以下是一般資料管理原則,可協助您建立強大的資料基礎。

團隊合作

企業使用者和技術團隊必須協同合作,以確保滿足組織的資料需求。所有資料處理和分析應優先考慮商業智慧需求。否則,收集的資料將保持未使用狀態,資源將浪費在規劃不當的資料管理專案中。

自動化

成功的資料管理策略將自動化整合到了大多數資料處理和準備任務中。手動執行數據轉換任務很繁瑣,也會導致系統中的錯誤。即使手動任務有限 (例如執行每週的批次作業) 也可能造成系統瓶頸。資料管理軟體可以支援更快且更有效率的擴展。

雲端運算

企業需要可提供廣泛功能的現代化資料管理解決方案。雲端解決方案可以大規模管理資料管理的所有方面,而不會影響效能。例如,AWS 可在單一帳戶內提供各種功能,例如資料庫、資料湖、分析、資料可存取性、資料管控和安全性。

AWS 如何協助進行資料管理?

AWS 是一個全球資料管理平台,您可以使用它來建立現代雲端資料管理策略。這些只是一些可以幫助您建立現代雲數據基礎架構的服務。

Amazon DataZone 是一項資料管理服務,可讓客戶更快、更輕鬆地編目、探索、共用和管理儲存在 AWS、內部部署和協力廠商來源之間的資料。

AWS Glue 是一種無伺服器服務,可讓資料整合變得更簡單、更快、更便宜。您可以發現並連線到超過 100 個不同的資料來源,在集中式資料型錄中管理您的資料,並且以視覺方式建立、執行與監控資料管道,將資料載入到您的資料湖、資料倉儲和湖倉。

Amazon 簡易儲存服務 (Amazon S3) 是一項物件儲存服務,提供領先業界的擴充性、資料可用性、安全性和效能。各種規模和各業界的數百萬家客戶可以存放、管理、分析和保護幾乎任何使用案例的任何資料量,如資料湖、雲端原生應用程式和行動應用程式。

AWS Lake Formation 可讓您集中管理、保護和共用資料以進行分析和機器學習。AWS Lake Formation 可協助您集中管理和擴充精細的資料存取權限,並在組織內外安心地共用資料。

Amazon 關聯式資料庫服務 (Amazon RDS) 是一項易於管理的關聯式資料庫服務,針對總擁有成本進行最佳化。根據需求設定、操作和擴展很簡單。

Amazon 虛擬私有雲 (Amazon VPC) 可協助您在邏輯隔離的虛擬網路中定義和啟動 AWS 資源。Amazon VPC 協助確保雲端環境中的資料隱私。

立即建立 AWS 帳戶,開始在 AWS 上建立雲端資料管理解決方案。