使えるデータカタログにするには?

Mohamed HassanによるPixabayからの画像

データの仕様情報のことをメタデータと呼びます。
このメタデータを管理するために「データカタログツール」を導入するケースが増えてきています。データベースに接続し、システム名、テーブル名、カラム名、PK、データ型、桁数などを取得し公開する・・・といった使い方が典型的なツール導入の例ではないでしょうか。

しかし、これだけでは、データ利用者にとってあまり有益な情報とは言えませんね。残念ながら、高価なツールを使いこなせず宝の持ち腐れになっている場合もあります。
このようなミスマッチを避けるためには、どうすればよいでしょうか?誰が(Who)、どのような目的(Why)で、どんな時(When)に、何を(What)どうやって使いたいのか(How)、というユースケースを考えていけば、どのようなメタデータを管理すれば、役に立つのかが見えてくると思います。

●誰が利用するのか(Who)

メタデータを見たいのは誰でしょうか?
社内外のデータを利用して分析する方、データ分析の基盤を構築する方、業務システムの保守や改修を担当する方、業務を実行する方などが想定されます。

●どのような目的で利用するのか(Why)

ここからは、利用者によって目的が変わります。
データ分析担当の方であれば、社内にどのようなデータが存在するのか?それはどのシステムで管理されているのか?というデータの所在の特定や、分析するデータ項目の意味などを把握したいなど、主にデータ分析のために必要な情報を得ることが目的になります。
業務システムの保守・改修担当の方であれば、トラブル発生時にどの処理がどのテーブル、データ項目に影響を及ぼしているのかを把握することなどが目的になります。
また、業務担当の方であれば、業務で使用している画面に入力している項目の意味や入力してよいデータの値の範囲や計算式などの業務ルールを知りたい、ということが目的になります。

●どんな時に(When)

メタデータを見たくなるのはどんな時でしょうか。
データを分析する時、システムの影響調査をする時、そもそもシステムを開発する時、業務を実行する時など、実は、カタログが整備されていれば、それらを参照したい時は沢山あると思います。

●何を(What)どうやって使いたいのか(How)

どのようなメタデータをどうやって使いたいか、ですね。
一例になりますが、購買履歴データを使って顧客の購買動向を分析するケースで考えてみましょう。まずは、購買履歴というデータを取得します。しかし、そのデータがどこにあるのか分かりませんね。そこで、データカタログを使用して、「購買履歴」と入力して検索したり、テーブル一覧からそれらしいテーブルを探すことができたりすると嬉しいですね。そこから、どのシステムが管理しているどういうテーブルが、欲しいと思っている「購買履歴」なのかを探し出し、データを取得していきます。
また、「購買履歴」のデータを取得しただけでは、数字や文字が羅列されているだけなので、どの値が商品コードなのか、顧客IDなのか、金額なのかが、直ぐには分かりません。
そこで、データカタログを使用して、「購買履歴」のデータ項目やその意味が把握できれば、分析作業を始めることができますね。
場合によっては、この「購買履歴」には極端な購入金額など異常値が含まれていたり、実は5年前ぐらいから更新がない古いデータだったりするかもしれません、こういったデータの品質や鮮度の情報も、あらかじめ取得できると利用者にとっては役に立ちます。さらに、購買履歴には、ECサイトから基幹システムを経由するものと、店舗のPOSデータがデータ統合基盤で保持されている、といったデータリネージュ(系統図)も見えてくると、自分が分析しているデータが、どこから登録されたものなのか、加工がされているのか否か、などが分かるようにもなります。

このような観点で、ユースケースが整理できれば、どのようなメタデータが管理できていると良いのか、どう見せると良いのか、そしてどう集めていくと良いのかを考えていくことができるようになります。
ここで初めて、データカタログツールの導入か、AccessやExcelでの管理で十分かが見えてきます。また、データカタログツールの導入スコープについて、データ利活用基盤の範囲で考えればよいのか、ゆくゆくは全社のデータ資産を全て管理することまで視野に入れるのかにより、選ぶツールも異なります。このあたりは、別の機会に検討のポイントなどを紹介したいと思います。

●最後に

使い方をイメージして、どのようなメタデータを管理するのかを検討することで、使えるデータカタログにしてくことができるのでは?と思われたのではないでしょうか。
もちろん、器だけ準備しても、登録されているメタデータ自体が有益な内容でなければ、意味はありません。データ項目の意味定義は誰もが分かるようにしっかりと記述しておくなど、考えることは沢山あります。
メタデータ管理について、その目的や検討の進め方や成果物を解説した教育コースを準備しています。「使えるデータカタログ」を目指したいと思われている方は、この機会に受講されてみてはいかがでしょうか。

データマネジメント・アカデミー ~メタデータ管理コース~