データマネジメントにおけるビジネスデータスチュワードの重要な役割
ビジネスデータスチュワードは、データ資産の品質と使いやすさを改善させる多くの取り組みにおいて重要な役割を担っています。データ品質とメタデータ品質の改善、リファレンスデータやマスタデータの管理、コンプライアンス遵守やプライバシー保護などです。今回は、これらにビジネスデータスチュワードがどのように貢献し、鍵となる役割を果たすのかについてご紹介します。
データ品質改善におけるデータスチュワードシップ
データ品質の改善は、データスチュワードシップの取り組みの中で、最も目に見えてインパクトがある成果の一つです。これこそが、データスチュワードシップの本質的な目的ともいわれています。データおよびメタデータの品質改善により、企業は効率的に運営でき、データからより多くの価値を引き出すことができます。そのため、データスチュワードシップの投資対効果(ROI)の多くは、データ品質の改善に関与しています。
プロトキン氏は、データ品質管理のステップを以下のように定義しています。
- データ品質を管理すべきビジネスデータエレメント(BDE)の選定および定義
- データ品質要件(ルール)の定義
- ルールに基づいたデータプロファイリング
- データ品質異常のレビュと評価
この中でも、4.のデータ品質異常のレビュと評価はビジネスデータスチュワードが意思決定をしなければならない場面になります。
異常が発生しているデータはルール違反なのか、その違反を是正する価値はあるのかを判断しなければなりませんし、そのための調査も必要になります。また、高品質なデータを得るための代替案の検討や、異常によって起こるデータ問題に対処しない場合のビジネスへの影響度評価、問題対応に割くリソース優先順位付けなども合わせて求められます。
メタデータ品質改善におけるデータスチュワードシップ
ビジネスデータスチュワードの取り組みの多くはメタデータに関することです。
BDEの定義、BDEと物理インスタンスとの関係、リネージなどは全てメタデータです。高品質なメタデータを作成し、そのメタデータ自体の品質を測定することも、ビジネスデータスチュワードの責任になります。これは、データ品質の測定と改善にとっても、特に重要です。何がデータの品質の高さを決定するかについてのルールと、そのルールに照らし合わせてデータをプロファイリングした結果もメタデータだからです。これらのメタデータもデータ品質管理と同様に、完全性、妥当性、アクセス性などの評価軸に従って、品質ルールを定義し、定期的に測定することで品質を保つべきです。しかし、定義などのメタデータの多くはテキストデータであるため、その内容の良し悪し自体を自動チェックすることはできません。一方で、以下のような測定やチェックであれば自動検知でき、メタデータの修正や品質向上につなげていくことができます。
- 完全性:すべてのビジネス用語が定義されているか、導出フラグが「真」に設定されている場合は、導出方法が書かれているのか、など、全て入力されているかどうかのチェック。
- 一貫性:他のメタデータとの矛盾がないか。例えば、値事例を管理するのは特に重要なBDEだけで、「主要BDEフラグ」を立てるべきなのに立っていない、などの矛盾の検知。
リファレンスデータマネジメントにおけるデータスチュワードシップ
リファレンスデータとは、区分やカテゴリなどの他のデータについての分類体系の集合を指します(これらは、マスタやトランザクションなどの他のデータから参照〔リファレンス〕されるデータです)。
ビジネスデータスチュワードは、値の有効範囲を決定するだけでなく、値の意味を定義し、さらに必要に応じて値を追加するなど、その値のマネジメントを主導します。たとえばDWHでは異なるソースシステムのリファレンスデータを統一し、全社共通のデータ視点を提供しなければなりません。
このようにビジネスデータスチュワードは、重要なシステムのリファレンスデータの維持管理において、鍵となる役割を果たします。
マスタデータのID解決におけるデータスチュワードシップ
同じ実体を表す複数のデータインスタンスを、単一レコードに帰着させることをID解決と呼びます(日本では名寄せと呼びます)。ビジネスデータスチュワードはID解決の対象レコードを持つシステムを突き止め、解決のために必要な属性をプロファイリングし、これら属性を基にID解決の対象レコード同士をマッピングして、ゴールデンレコードを作成します。また、マッピングの際に識別属性が一致しているとみなせるスコアの閾値の調整や、マッピング精度向上のために追加の識別属性を定義したりします。
さらにID解決の際には、複数レコードで値が異なるときどちらをゴールデンレコードとして残すのかを決定するルールも定めなければなりません(プロトキン氏はMDMサバイバーシップと呼んでいる)。例えば、ソースシステムの信頼性や最新の更新日などを基に判断するなどのルールになります。
情報セキュリティにおけるデータチュワードシップ
データのプライバシーとセキュリティを保護することも、ビジネスデータスチュワードの主要な役割の一つです。情報セキュリティで定められたポリシーに従ってBDEを分類し、さらに物理的にデータベース内のどこにあるのかを明らかにします(保護自体はIT側に委ねられます)。
データプライバシー規制におけるデータスチュワードシップ
EUの一般データ保護規則(GDPR)、カリフォルニア州消費者プライバシー法(CCPA)など、近年ではデータプライバシーに関する規制が厳しくなりつつあります。これらの法規制に遵守するためにも、ビジネスデータスチュワードは、機微で個人を特定できる情報(PII:Personally Identifiable Information)とそれに関したビジネスルールを理解しておく必要がありますし、こうしたルールに基づいてデータが確実に取得、保存、処理されるように促進しなければなりません。
その他にも、プロジェクトの品質保証サポート、リネージ作成、ビジネスプロセスのリスクマネジメントにおいても、ビジネスデータスチュワードの役割が定義されていますが、紙面の都合上割愛させていただきます。
ご興味のある方は、是非とも書籍「データスチュワードシップ ~データマネジメント&データガバナンスの実践ガイド~」(https://metafind.jp/books/data-stewardship/)をお手に取ってご確認ください。
このように、ビジネスデータスチュワードが果たす役割は多岐に渡りますが、あくまでその原点はBDEに対する正確なメタデータ定義にあります。これにより、データ品質の測定や向上、マスタデータのゴールデンレコード作成、コンプライアンス遵守やプライバシー保護に対処できるようになります。
次回以降は、この「ビジネスデータエレメント(BDE)」について、ご紹介していきたいと思います。