用語解説:データ品質管理とは
●データ品質とは
DMBOK2ではデータ品質について次のように定義しています。
「データ品質の度合いはデータ利用者の期待と要求を満たす度合である。つまりデータが果たすべき目的に合致しているかどうかである。」
DMBOK2
また、国際的に有名なデータ品質管理の専門家であるDannet McGilvray氏は、著書『Ten Steps to Quality Data and Trusted Information™』の中で、データ品質について次のように説明しています。
「データ品質とは、データが、必要とされるあらゆる用途において、信頼できるソースとなり得る度合のことである。簡単に言うと、適切な情報を、適切な時に、適切な場所で、適切な人が、ビジネスを行うために利用できることである。」
Dannet McGilvray 『Ten Steps to Quality Data and Trusted Information™』
つまり、データ品質はビジネス要求に対する評価基準であり、この基準を満たしていればデータは高品質であり、そうでなければ低品質ということになります。
●低品質なデータによるリスク
低品質なデータはどのようなリスクをもたらすのでしょうか。DMBOK2では、次のように説明しています。
「低品質のデータは危険をはらんでいる。組織の評判が損なわれ、罰金、収益の損失、顧客の喪失、否定的にメディアから取り上げられる、といった事態を生む危険がある。」
DMBOK2
低品質なデータが及ぼす影響について、温室効果ガス排出量を測定し、報告するケースを例に考えてみましょう。日本では、大量に温室効果ガスを排出する企業には、国への排出量報告が義務付けられています。もし、データ入力時のミスなどで誤った値が測定データとして登録され、そのデータを利用してレポートを作成してしまうと、誤った報告になってしまいます。悪意がなくても、低品質なデータにより、企業には罰則が科せられたり、評判が損なわれたりするなど、多大な損失を被ることになります。
●高品質なデータによる効果
では、高品質なデータはどのような効果をもたらすのでしょうか。DMBOK2では、次のように説明しています。
「信頼性の高いデータはリスクを軽減し、コストを削減するだけでなく、効率を向上させる。信頼できるデータを利用すれば、問合せに対して従業員はより迅速かつ一貫して回答できる。データが正しいかどうか確かめようとする時間を減らし、納得した上で判断し、より多くの時間を顧客サービスに利用できる。」
DMBOK2
新規顧客獲得のためにマーケティングを行うケースを例に考えてみましょう。顧客の年齢層や性別などの顧客属性データや購買データが正しく登録されていれば、それを分析してターゲットとしたい顧客を明らかにし、効率的にマーケティングすることができます。また、データ利用者は利用に問題がないか、分析の都度担当窓口に問合せしなければならないストレスから解放されます。
●データ品質管理とは
「データ品質」を維持するにはどのような管理が必要になるでしょうか。DMBOK2では、「データ品質管理」を次のように定義しています。
「品質管理技術をデータに適用するアクティビティを計画し、実施し、制御する。これによって、データが様々な目的で利用されて、データ利用者の要求に合致することを保証する。」
DMBOK2
要するに、データ品質管理とは、データを必要とする人の要求に基づいて、データの品質を改善し、維持管理する一連の活動を意味しています。DMBOK2では、PDCAサイクルが紹介されています。PDCAとは、Plan(計画)-Do(実行)-Check(評価)-Action(改善)のサイクルを継続的に実施し、品質を高める手法です。製造業やサービス業の継続的な品質改善などで用いられるイメージが強いかもしれませんが、データも同様にPDCAサイクルを適用して品質改善を図ることができます。PDCAの各フェーズでは次のような活動を実施します。
- Plan:
データ利用者の要求を基に、データ品質の評価基準や尺度を定義します。また、データプロファイリングの実施、その結果に基づくデータ品質改善要否の検討、改善が必要な場合の定期的なデータ品質測定方法の策定などを行います。 - Do:
Planで策定した方法に基づき、定期的にデータ品質を測定します。そして、その結果をレポートにまとめます。 - Check:
Doの測定結果から、要求が満たされているか評価し、改善の要否を判断します。改善が必要な場合は、解決策を検討します。 - Action:
Checkで検討した解決策を実行します。実際に、データ品質が要件を満たすようデータを修正します。更に、データ修正だけでは対応が不十分な場合は、システムを改修するなどして根本原因を解決します。
●データ品質管理活動を支える組織
ここまでは、データ品質管理の基本的な考え方について説明しましたが、データ品質管理を継続的に実施するためには、活動を支える組織が欠かせません。DMBOK2では「データ品質チーム」という組織が登場します。このチームは、データ品質を測定したり、データ品質管理の活動を評価したりします。そして、問題が見つかった場合は、その原因を分析し解決策を検討します。
この時、データ品質チームは様々なステークホルダーと協業することが求められます。なぜなら、技術的な問題を解決したい場合は開発部門に協力を仰ぐなど、必然的に専門部門のサポートが必要になるからです。
DMBOK2では、具体的にどのような組織がデータ品質チームの役割を担うと良いのかについて明記されていませんが、組織体制について次のように説明しています。
「ほとんどの場合、データ品質プログラムは基幹業務レベルやアプリケーションレベルで行われるという側面があるため、データ品質を管理する機能の全てが中央に集中することはまれである。(要約)」
DMBOK2
つまり、データ品質チームの役割を担う組織は、全社を統括する組織よりも、事業や業務領域毎にデータマネジメントの活動を実施する組織のほうが適していると言えそうです。
●最後に
弊社ではデータ品質管理の教育コースを展開しています。具体的な進め方や成果物、成功の秘訣について知りたい方は、ぜひ教育コースの受講を検討してみてください。