ADMC2022カンファレンスレポート
~データ統合基盤アーキテクチャ検討のポイントを学ぶ~ 

●はじめに

11/15(火)、DAMA日本支部主催による年次カンファレンスであるAsian Data Management Conference 2022(ADMC2022)が開催された。

  第12回 Asian Data Management Conference 2022 in Japan
  ビジネスを牽引するデータアーキテクチャの今

今年はデータアーキテクチャをテーマに、メタデータ管理からデータリテラシまで、海外の先進的な考え方や国内企業の取組みが紹介された。
最近、「モダンデータアーキテクチャ」と題してデータ統合基盤のアーキテクチャについての関心が高いこともあり、約300名を超える申し込みがあって非常に盛況だった。

筆者は、セッションの中でもデータ統合基盤のアーキテクチャについての発表が印象に残った。本ブログでは講演内容の一部をご紹介しつつ、カンファレンスを通じて筆者が学んだ、データ統合基盤のアーキテクチャ検討を進める上で重要だと考えるポイントについて紹介する。

その前に、そもそもデータアーキテクチャとはなにかについて振り返ってみよう。
DMBOK2では、データアーキテクチャについて企業のデータニーズを明確にし、マスターとなる青写真を設計し、維持する活動と定義している。
一方、ADMCで講演された日本電信電話株式会社の駒沢健氏は、データアーキテクチャについて、要約すると、仲間と共有できる共通の下敷きを求める活動と定義されていた。 要するに、“青写真”や”共通の下敷き”などのあるべき姿を定義するだけでなく、”それを設計し維持する活動”もデータアーキテクチャに含まれることを押さえておきたい。

●最新のデータ統合基盤アーキテクチャニーズと課題

データ統合基盤については、海外講演者のひとりJohn O’Brien氏(Radiant Advisors)が、詳しい発表をされていた。O’Brien氏は、最新のデータアーキテクチャは次の3つのニーズに応えられるべきだという。

  1. Business Intelligence and Reporting(BI分析とレポーティング)
  2. Self-Service Data Analytics(セルフサービス分析)
  3. Data Science ML and AI(データサイエンス・機械学習・人工知能)

従来は、1のようにBI分析や定型レポートの作成に必要なデータを収集・変換し、管理する基盤が求められてきた。しかし、データ分析のトレンドが変化する今日、3のように機械学習や人工知能といった最先端のデータ分析手法にも応えられるデータアーキテクチャが求められている。
このような業界の動向を考慮せず、従来のやり方だけでデータ統合基盤のアーキテクチャ検討を進めると、データ利活用者のニーズが変化していることも把握できない。そのため、必要とされるデータが収集されていない、もしくは、見たい軸で集計できない基盤となり、基盤とデータが活用されないという趣旨の説明をされていた。

●データアーキテクチャ検討のステップ

では、活用されるためにはどのようにデータアーキテクチャを検討するべきか。O’Brien氏によると、次の4つのステップが重要だという。

  1. Business Strategy(ビジネス戦略)
  2. Data & Analysis Capabilities Strategy(データ&分析のためのケイパビリティ戦略)
  3. Modern Data Architecture(モダンデータアーキテクチャ)
  4. Modern Data Infrastructure(モダンデータインフラストラクチャ)

それぞれ、具体的な進め方について、次のように説明されていた。

最初に、ビジネスのゴールは何か、それを達成するためにはどのようなデータが必要なのかを明確にする。
次に、ビジネスのゴールを達成するためにはどのようなデータ分析が必要なのか明らかにする。
そして、どのようなデータ分析を行うかが決まったら、それぞれが必要とする分析環境や基盤など、サブアーキテクチャを含めた全体のデータアーキテクチャを検討する。
最後に、データアーキテクチャの構成要素と製品を選定する。

第12回 Asian Data Management Conference 2022 in Japanビジネスを牽引するデータアーキテクチャの今

しかし、O’Brien氏も述べているように、最初のステップはしばしばおろそかになりがちである。筆者のコンサルティングの経験からも、ステップ1のビジネス戦略によるデータのニーズが明確でないことが多いと感じる。それだけステップ1を実行するのは、難しいのかもしれない。

ではどうステップ1を実施し、データ利活用者のニーズを明らかにすればいいのか?
前述の駒沢氏が発表されていた、”ダッシュボードドリブン”という取組みが有効になりそうだと、筆者は考えている。

ダッシュボードは見る側の視点で作ることが非常に大事である。
具体的には、最初にダッシュボードのイメージを作成する。
次に、それを実現するためにはどのようにデータを蓄積・流通すれば良いのか、どのコードを共通化すれば良いのかを考える。
最後に、必要なデータを流してもらえるようソースシステムのデータを設計する。

第12回 Asian Data Management Conference 2022 in Japanビジネスを牽引するデータアーキテクチャの今

つまり、必要とされるダッシュボードイメージから逆算して必要とされるデータを明確にしていくという考え方だ。なお、ここでいっているイメージは、必ずしも実際に利用するダッシュボードである必要はない。

昨今は、O’Brien氏のステップ3や4のように、ソースデータからセントラルウェアハウスへの連携処理や、具体的な製品選定といった物理的な視点から検討を進めるケースが多い。

しかし、国内外に関わらず知見者はステップ1を最も重視していて、初めにビジネスが必要とするデータを明らかにし、その後、分析基盤の必要性や必要となる製品の選定を行うべきだと考えている。

●最後に

データ利活用を推進するためにデータ統合基盤のデータアーキテクチャを検討する際は、分析を行うデータの最終利用者の視点が重要であることを学んだ。
これからデータアーキテクチャの検討を始める方は、ビジネスニーズを明確にするところから着手してみてはいかがだろう。
また、既にデータアーキテクチャを導入している方は、今一度ビジネスニーズを十分に満たしているか評価してみると良いだろう。

カスタムフィールドなどの情報