データスチュワードシップ実現に向けて解決すべき課題(前編)

以前ブログで紹介したプロトキン氏の『データスチュワードシップ データマネジメント&データガバナンスの実践ガイド』(以下、本書と呼ぶ)の翻訳中に、ビジネスデータエレメント(BDE)という新たな概念の曖昧さに気が付いた。私は、BDEこそがデータガバナンスの中核であると確信しているものの、その概念の曖昧さを補った上で「データスチュワードシップ」の考え方を取り入れ、より実践的なデータマネジメントの手法を構築する必要があるようだ。 これを解決すべく、コミュニティと共に議論を深めたい。
前編では、
- データマネジメントの現状と手法の限界
- 新しいアプローチ:ビジネスデータエレメント(BDE)
を解説し、後編では、
- データマネジメントにおけるBDEの問題点
- 何を補うべきなのか
について意見を述べる。
データマネジメントの現状と手法の限界
現状
データマネジメントは企業の情報資産を支える基盤だ。しかし、DXの進展により、データの活用範囲が拡大し、従来のマネジメント手法では対応しきれなくなっている。
例えば、「データの解釈が統一されていない」「システム間でデータが食い違う」など、企業は日々データの課題に直面している。
これを解決するためには、「メタデータの一貫したマネジメント」「データスチュワードシップの強化」 が不可欠である。
プロトキン氏は本書の中で、現状のデータマネジメントの課題を6つ指摘しているが、その最後の「私たちデータコミュニティには長い歴史と習慣があり、データの意味とデータの内容の両方において、曖昧さを許容してきた」は、まさに情報システムを提供する側と使う側の双方にとって、特に我々データマネジメントのプロには非常に厳しい、痛い指摘ではないだろうか。
そもそもこうした企業や社会が当たり前に見過ごしてきた「悪い習慣や文化」は、なぜ温存されているのだろうか。例えば、IT部門とビジネスユーザー間の長い間のコミュニケーション不全に伴うお互いの「諦め」もあるのではないか。
データの意味を明確に表現するデータモデルやISO 11179などの科学的手法が確立し何十年も経つのに、なぜこのような悪習を断つことができていないのか。
手法の限界
以前のブログでメタデータマネジメントの世界標準として紹介したISO 11179については、新規システム構築時の物理データ層のデータ標準化が中心であり、既存システムに適用するのは非常に困難だと述べた。
また、物理データ層(下図の表現層)のガバナンスが前提であり、ビジネスユーザーがこれらの情報を活用することは少なかった。本来、データマネジメントにはビジネスユーザーの主体的な参画が欠かせないが、この手法では困難であった。
なぜなら、ビジネスユーザーがデータの意味を理解し活用できなければ、ガバナンスが現場で機能しないからだ。
ISO 11179を適用する場合、物理データ層の標準化が優先されるため、次のような特徴がある。
- 概念ドメインやデータエレメント概念は抽象的でその効果が不明なため、定義が省略されがち。
- 値ドメインの管理は必須であり、かつ全てのデータエレメントに値ドメインが1つ対応する。
- 値ドメインはデータエレメントが持つ値制約と物理的な形式や桁数(文字 n桁、数字 n桁サイン付きなど)まで規定する。

新しいアプローチ:ビジネスデータエレメント(BDE)
BDEはビジネスデータの意味と管理を統一する新たな手法である。私は本書で初めてBDEというものを知り、これはビジネスユーザーを巻き込んでデータガバナンスを行う上で非常に有効であると直感した。
「データエレメント」という既に普及したメタデータの標準用語に、「ビジネス」という組み合わせは中々魅力的に感じたのも事実だ。もしかして、これこそISO 11179の限界を突破できる銀の弾になるのかもと。
BDEの重要性
データマネジメントの基本的な目的は、データをビジネスに有効活用できるように品質を維持・改善することである。そのためには、個々のデータを適切にガバナンスする必要がある。
企業のデータマネジメントにおいて、最も基本的な単位は物理データエレメント(PDE)である。これはデータベースのテーブルのカラムなど、システム上で実際に管理されるデータのことを指す。しかし、PDEだけでは「このデータがビジネス的にどのような意味を持つのか」を正確に把握することはできない。
そこで登場するのがBDEである。
なぜBDEが重要なのか:「顧客ID」が「会員管理用」か「購入履歴用」か、「売上日」が「決済日」か「購入日」かなど、曖昧さを解消し、①データの意味を統一、異なるシステム間での解釈のズレを防ぐ、②品質を改善し、エラーの削減やデータ重複の排除につなげる、③ガバナンスを強化し、統制のとれたデータ管理を実現する。
BDEの役割
BDEはPDEにビジネス上の意味を与え、品質を統制するメタデータだ。既存システムを改修せずにガバナンスを強化できる。
本書にある事例(以下、下線部引用)で具体的な定義を見てみよう。以下は保険会社における顧客の婚姻ステータスコードの有効値に関するルールである。
- ビジネスデータ品質ルール:婚姻ステータスコード(Marital Status Code)は独身(Single)、既婚(Married)、死別(Widowed)、離婚(Divorced)の値を持つことができる。空白のままにすることはできない。新規顧客の入力時に値を選択する必要がある。顧客がかつて結婚していたか、現在結婚していないかどうかにリスク要因が影響されるため、死別と離婚の値は独身とは別に記録される。
- データ品質ルール仕様:顧客(Customer)テーブルの婚姻ステータスコードのカラムには「S」、「M」、「W」、または「D」を指定できる。空白は無効な値とみなされる。
ビジネスデータ品質ルールはBDE自身が持つべき品質ルールを定義し、データ品質ルール仕様はBDEに紐付くPDEに対する品質ルールの仕様を定義している。
すなわち、BDEで定義された品質ルールは該当のPDEにも継承されて、PDEの品質を統制することになる。
こうすることで、BDEによりPDEのデータ品質をガバナンスできる。
BDEのグループ化
本書では、従来のサブジェクトエリアよりも細分化された「データドメイン」という管理単位を導入することで、より柔軟なデータガバナンスを実現できると主張している。
例えば、金融機関のリスク管理では、「預金」「ローン」などの商品別にデータスチュワードを設定することで、より細かいデータ統制が可能になる。
ここまで、BDEの概要とその可能性について解説した。
では、BDEにはどのような概念の曖昧さあるのか?
後編では、BDEの 問題点を深掘りし、解決の方向性について意見を述べる。
次回:「データスチュワードシップ実現に向けて解決すべき課題(後編)」
お楽しみに!