データスチュワードシップ実現に向けて解決すべき課題(後編)

前編ではデータマネジメント中核であるBDEについて解説した。しかし、BDEについて深く考察するほど、定義の曖昧さなど問題点が見えてきた。後編では、その問題点と何を補うべきなのかについて述べる。
データマネジメントにおけるBDEの問題点
BDEとは
この論文『車輪の再発明?複雑なデータウェアハウス環境におけるハーモナイゼーションと再利用はなぜ失敗するのか』(2011年1月 Torsten Priebe,Andreas Reisser,Duong Thi Anh Hoang著)によると、BDEはある企業の論理データモデルから派生した概念であり、ビジネスデータ構造と用語を組み合わせたもので、エンティティや属性とは異なる緩い定義となっている。以下のBDEモデルもメタモデルも上記論文から引用したものである。
ビジネスデータ構造とは「組織にとって関心のあるオブジェクトであり親子階層で構成される」とあり、エンティティよりも緩いものであり、BDEは「ある構造におけるビジネスデータ用語の断面である」とある。
すなわち、このBDEはエンティティの属性に似てはいるが、ステータス閉鎖、ステータス有効など属性ではない用語(例えば、属性である口座ステータスコードの値名称)も含めていることに注意しよう。
また、「ERモデルとの主な違いは同じビジネス用語を異なるデータ構造で再利用できる点にある」とある。
以上のことから、このビジネスデータ構造やBDEは、正規化を前提としたエンティティや属性とは大きく異なるものであることが分かる。
論文では、DWH上で様々なソースデータは、そのままでは同じ意味のデータなのかがわからず、再利用やトレーサビリティができない。
セマンティックなビジネスモデルとしてビジネスデータ構造とBDEを定義し、ソースデータとマッピングすることで、それらを実現することと、さらにビジネスユーザの理解を深めることを目的としている。
金融機関のBDEモデル例

BDEメタモデル

問題点
以下に、BDEをデータマネジメントの基礎として活用する場合の問題について考察する。
1:基礎概念の緩さ
緩い概念ゆえに複雑・多様なPDEのビジネス上の意味やルールを管理し易いだろうが、データモデルから切り離されたBDEは一貫性を欠き、部門間で解釈がバラバラになるリスクがある。
これを基盤とするガバナンスは困難だ。論文も課題として「ビジネスデータ構造は企業全体で整合させるべき」と指摘し、データモデルの必要性を示唆している。
2:異種概念の混在
BDEには本来のデータエレメントだけでなく用語も含めており、異なる概念が混在している。これは要件仕様とBDEを直接関連付けしているためと考えられる。
例えば、要件仕様として「口座ステータスが現在有効で口座開設日がいつ以降の残高を知りたい」とあった場合に、構成BDEとして「ステータス有効」という用語が必要になる。
しかし、データエレメントは本来、データの最小構成要素(元素)であり、単なる用語を含めるべきではない。
3:ISO 11179観点の欠如
値ドメインが分離されておらず、ビジネスデータ層の正規化が不十分だ。ISO 11179の中核をなす値ドメインの考え方そのものは、データガバナンスを実現する上で強力な武器になるのではないか。
すなわち、ビジネスメタデータに対して新たに値ドメインの考え方を適用できれば、データガバナンスに有効ではないか。
何を補うべきなのか
前編でも述べたが、プロトキン氏の書籍に書かれているBDEこそが、データガバナンスの中核であると確信していた。
しかし、このままではBDEがあいまいな概念となるため、補足が必要だ。
それは、データモデルを前提に新たなBDEの位置付けを明確にし、ISO 11179と統合した標準メタモデルを策定することではないだろうか。
また、本書の主題である「データドメインによるデータスチュワードシップ」の考え方を取り入れ、より実践的なデータマネジメントの手法を構築することも重要である。
DXの進展や生成AIの活用が進む中で、データマネジメントの適切性がこれまで以上に企業の競争力を左右する時代となった。
ガバナンスの中核となるBDEがあいまいな概念のままでは、企業の情報資産として正しく定義できないばかりか、十分に活用もできず、不適切なデータ解釈によって誤った意思決定を招くリスクすらあるかもしれない。
結果として、最初に問題提起した「データの意味とデータの内容の両方において、曖昧さを許容してきた」に逆戻りしかねない。
だから今こそ、我々データマネジメントの専門家がこの問題に正面から向き合い、データガバナンスをリードしていくことが求められる。