データファブリック

データファブリックの定義

データファブリックの定義は、最近ではガートナーが整理した次の定義が定着している。

・データと接続プロセスの統合レイヤーとして機能する設計コンセプト

・既存の検出でき推論可能なメタデータ資産を継続的に分析して、ハイブリッドやマルチクラウドプラットフォームなどのあらゆる環境で統合され再利用可能なデータの設計、展開、利用を支援する

Gartnerサイト” Data Fabric Architecture is Key to Modernizing Data Management and Integration” (2022/7/20)

企業内に分散しているデータが意味で紐付いていく様を織物(ファブリック)の経糸と緯糸の織り重なる様に見立て、データファブリックと呼んでいる。

データファブリックには以下2つの特徴がある。

特徴1 分散管理されたデータを仮想的に統合して提供

データファブリックでは、オンプレミスからクラウド、テーブルからファイルまで、全社データのメタデータを収集し、可視化し、組織を横断して公開します。さらに、そのメタデータに基づいて仮想的なビューを生成し、データを提供する。
つまり、物理的にデータを一元管理する環境を必要としない。

特徴2 メタデータ管理の機械学習による支援

データファブリックでは品質の高い最新のメタデータを収集・更新し続ける必要がある。また、いつ誰がどんなデータを必要とするかわからないため、メタデータ収集対象は広域になりがちである。
メタデータ管理に関する作業の負荷を軽減するため、データファブリックでは、機械学習でメタデータ管理を支援し、可能な限り自動化する必要がある。

関連記事

前の記事

データライフサイクル