DMBOK2改定新版で大幅補強された第13章 データ品質
データ品質の難しさは組織間のコンテキストの違いに起因する
従来版のイントロダクションでは、データ品質の目的や必要性について説明し、組織の戦略目標を達成するためには高品質なデータの提供が前提条件であると解説されていました。
一方、改訂新版の冒頭では「高品質なデータとは何か」という定義を明確にすることが強く求められています。「データの品質はコンテキストに依存するものであり、ある領域では高品質とみなされる一方で、別の領域では低品質とみなされることがある」と説明されています。これにより、データ品質の問題を解決する難しさが浮き彫りになります。領域を跨いでデータ品質を改善しようとすると、組織内で利害対立が発生することがあります。そのため、各組織で「目的に適合した高いデータ品質」とは何かを共有し、コンテキストに基づく違いをどのように調整するかが重要となります。
データ品質評価軸の統一
データ品質評価軸とは、正確性(データが正確であること)や完全性(全てのデータが入力されていること)など、データの品質を評価する際の観点を指します。このデータ品質評価軸について、従来版では「DAMA・UKではこう解釈している」、また「ラリー・イングリッシュ氏の解釈はこうだ」など、各人の解釈の違いを解説するだけでした。そのため、DAMA日本支部の会員間でも、評価軸の解釈に違いが生じていました。「クレジットカード番号は定められた番号帯であること」の、評価軸は、有効性とするのか、妥当性とするのか、など頻繁に議論されていました。
改定新版では、複数の解釈を紹介するのではなく「一般的なデータ品質評価軸はこれである」と一覧で示し、それぞれについて例示を交えてわかりやすく説明されていますので、解釈で迷うことはなくなりそうです。
他の知識領域との関係性の記述が追加
データ品質の問題を解決するためには、第13章で解説されている内容を単に実行するだけでは不十分です。例えば、データ構造の設計が不適切であれば、データ入力方法を改善しても高品質なデータは得られません。また、メタデータの品質が適切に定義されていなければ、入力されるデータも不明確なものになります。今回の改定新版では、「データモデリングとデザイン」「メタデータ管理」「マスターデータと参照データ」など、他のナレッジエリアがデータ品質に及ぼす影響や関係性、取組み方についても言及しています。よって、データ品質管理にフォーカスしてデータマネジメントに取り組む場合でも、関連する他の章も併せて読み進めることをお勧めします。
弊社が翻訳した書籍『データスチュワードシップ ~データマネジメント&ガバナンスの実践ガイド~』もDMBOK2改定新版と同時に、先月リリースされました(https://metafind.jp/books/data-stewardship/)。この書籍では、データスチュワードが中心となってビジネスに影響を及ぼすデータを見極め、そのメタデータを可視化・定義し、データ品質を改善する方法などを解説しています。データ品質に関する内容も豊富に記載されていますので、ぜひDMBOK2改定新版と併せてご購読いただければ幸いです。