メタデータを維持管理するためには

ここのところ、メタデータを管理するためにリポジトリ導入を検討されているお話を良く伺います。データ利活用のためのデータレイク構築に合わせて、データの見える化を検討されているケースが一番多いようです。物理テーブル名、物理データ項目名、型、桁などのテクニカルメタデータの取得、物理データ項目同士の加工ロジックを基にしたデータリネージの作成は、リポジトリツールにより実現できます。

しかし、物理テーブルがどのような内容と範囲のデータを管理しているのか、物理データ項目に格納されている値の意味は何か、というビジネスメタデータは、それを知っている人にしか定義することができません。リポジトリ導入の際には、このビジネスメタデータを定義して常に最新状態を保つための仕組みも考える必要があります。

データ利活用のためにメタデータを管理しているとある企業では、システム開発の時に作成されるデータ定義書に着目し、そこに書かれている論理データ項目や意味の定義を収集し、ロジックで物理データ項目と紐づけて管理するようにしています。
また、物理データ項目の変更、データ定義書の更新の度に自動的にリポジトリも更新できるような仕組みが構築されており、常に最新化されていることから、リポジトリ利用者の評判も高く、非常に良く利用されているそうです。

このアイデアは面白いですし、まずは手元にあるデータ定義書からデータの意味を取り込むことから始めるのは良いと思います。
しかし、残念ながらデータ定義書にデータの意味が書かれていないことや、最新化されていないことも多く、限界があります。
やはり、ビジネスメタデータを良く知っている人を巻き込んで、品質を上げていくこともメタデータ管理の次のステップとして、考えなくてはなりません。

DMBOK2.0からヒントを探してみました。DMBOK2.0の中では、データの意味を定義する役割は「業務データスチュワード」にあると言っています。

業務データスチュワードは、業務の専門家であり対象領域専門家として認識されることが多く、担当する分野のデータに結果責任を負う。ステークホルダと協力してデータを定義し統制する。

Chapter03データガバナンス 1.3.5データスチュワードの種類より引用

日本の組織で考えると、業務の専門家は業務部門の方になります。
その方を業務データスチュワードに任命して、データの定義や最新化に参画していただくような体制づくりをしたいところです。

では、海外ではうまく体制がつくられているのか?というと、そうとも言えません。
DMBOK2.0のChapter12メタデータマネジメントの中でも、組織の問題と対応策について書かれています。(一部を抜粋して紹介します。)

・ほとんどの人が信頼できるメタデータの価値を認識していたとしても管理を実践するのは簡単ではない。

・メタデータ管理は多くの組織で優先順位が低い。一連の重要なメタデータは組織内の調整とコミットメントを必要としている。

・統制することで企業内のデータに対し直接的な品質の恩恵を受けられる良い例を探すことである。具体的な業務関連の例を取り上げて議論を深めよう。

・全社的データガバナンス戦略の導入には上級管理職のサポートと参画が欠かせない。それには業務とITのスタッフが組織を横断して緊密に協力し合うことが求められる。

DMBOK2.0のChapter12メタデータマネジメント より引用

直接的な品質の恩恵を受けられる良い例」というのを説得材料として、業務部門の方を巻き込んだ体制づくりに持っていけると良さそうです。
では、データ利活用のためのデータレイク構築というケースにおいて、業務部門が「直接的な品質の恩恵を受けられる良い例」にはどのようなものがあるでしょうか?

業務部門の中でも、データ利活用により業務改善もしくは事業創出する立場に向けてであれば、メタデータの品質がデータ分析作業の効率化に繋がることが分かるため、恩恵を感じてもらえます。
これは、メタデータの品質が良ければ欲しいデータが直ぐに探せ、データを理解する時間が短縮でき、意図したデータセットを用いて分析ができるからです。
難しいのは、これらに直接関りがないものの、重要な業務のメタデータを把握している部門の巻き込みです。良く検討されるのは、メンテナンスに対して何らかのインセンティブ(費用の配布など)を考えることや、リポジトリで定義したものを業務ナレッジとして部門内での共有に利用してもらう、などです。
業務ナレッジとして蓄積されていれば、部門異動時に業務を理解する手助けにもなります。協力体制を構築してメタデータの品質を維持管理するには、それなりにコストが掛かります。受けられる恩恵も含めて、組織的なメタデータの維持管理が、データ利活用の推進につながり、最終的には業務改善や事業創出につながるようなストーリを、企業の上層部に理解していただくような活動が重要になります。

ちょっと、遠い道のりに思えるかもしれません。まずは、今あるデータ定義書などを活用してビジネスメタデータを明らかにするところからでもスタートすることが重要です。そして、どのような恩恵を受けられるのか事例を積み重ね、それらをアピールして、徐々に業務部門を巻き込み、メタデータを維持管理する枠組みを作っていくというステップこそが、成功の近道なのではないでしょうか?