DOAの半世紀から次の新たな時代へ ~DMBOK翻訳者が語る~
DOAの起源
DOAの先駆的開拓者椿正明氏が2022年8月に亡くなった。
DOA(Data Oriented Approach)は1985年堀内一氏(当時日立)が使い始めたが、1975年にピーター・チェンがERモデルを発表したことが、データ中心指向の実質的起源と言えよう。
1975年第1回VLDB(大規模データベース)国際会議で、ピーター・チェンがERモデルの基礎となる概念を発表した同じ場で、椿氏は実装独立の概念データモデルを用いて開発したプラント会社のエンジニアリングDB事例を発表した。
この時以来、情報システム分野、特にデータ要件定義におけるサイエンスとしてのデータモデルが確立し、さまざまな表記法やツールが開発され、情報システムに関わる人に強力な武器が与えられた。
椿氏との思い出
私自身1985年に椿氏からデータモデリング手法を直接学び、またその後数年間、大規模プロジェクトで一緒に実践する機会を得た。
椿氏の日本における実践的DOA普及の功績は非常に大きく、その体系化された方法論は多くの大規模システム開発の現場で使われ、また人材育成にも役立った。
椿氏の方法論の特徴は、日本文化固有な緻密さを活かしたものであり、エンティティや属性の分類、粒度による配置ルールなどきめ細かい表記方法を、データモデルというサイエンスと融合させたことにあるだろう。
また、椿氏と一緒にプロジェクトを進めながら強く感じたことは、いつも現場主義に徹したDOAの実践的開拓者であり続けたことだ。例えば、プロジェクトの現場で起きる具体的な問題や課題に対して、いつも翌週にはデータモデルによる汎用的な解決策を提示した。
最近、ある企業のデータモデリングのプロジェクトに携わったが、AsisからTobeに展開する時に、非常に悩んだことがあった。Asisの処理の複雑性に引っ張られ過ぎて、中途半端な屋上屋を架すようなTobeモデルでしのごうと考えた。しかし椿氏だったらこれにどう対処するだろうかと自問自答し、椿氏ならデータモデルパターンの原則に合わせてこうするはずだと、2週間ほど悩んだ末に乗り切ったことが、今ではよい思い出となっている。
椿氏が亡くなったのはこの数週間後だった。
私の思い
データモデルの呼び名について混乱があるようだ。
概念データモデルは、1975年に提唱されたANSI/SPARC3層\スキーマの概念スキーマを表現するものとして呼ばれてきた。
日本ではDOA普及当初からこの呼び名が定着し、IPAの情報処理技術者試験などでも使われている。
ところが、データマネジメントの教科書であるDAMA-DMBOKでは、ザックマンのEAフレームワークをベースに、上記の概念データモデルを論理データモデルと呼び始めた。その中では、概念データモデルは、主要エンティティ同士の関係を現す概要モデルに位置付けられている。 今までこの対応のズレによる混乱が多く指摘されてきたが、統一されそうもなく混乱は続いたままだ。
データの種類についてDMBOKでは、カテゴリ/リソース/業務イベント/詳細トランザクションと4つに分けている。また、カテゴリデータを業務ルールの基となるデータとして、リファレンスデータ、リソースを業務遂行の共通データとして、マスタデータと呼んでいる。
椿氏は当初から、タイプリソース/オカレンスリソース/業務イベント/異動イベントなどと呼んで、特にリソースに付いては全社共通データとして管理すべきとした。いわばマスタデータ管理の重要性を早くから強調してきた。
さらに、タイプリソースも重要なモデリングの対象とし、そのコード値と内容の事例まで表記しているが、他のデータモデルではこの表記を除外している。
重要なタイプリソースを表記することは、複雑・大規模なデータモデルをレビュし共有する上で、非常に効果的だと実感している。特にデータモデル上の属性に対して、具体的な業務上の値の意味を理解し共有することで、抽象的な2次元のデータモデルがよりダイナミックになり、処理内容も具体的に見え易くなる。
またDMBOK では、データモデルの品質評価指標として、要件充足度・完全性・汎用性・命名規則・読み易さなど10項目あげて、各項目に重み付けして総合評価するスコアカード方式を提案している。この中で、読み易さという指標でエンティティの配置ルールをあげていて、他の評価軸の前提となるとしながら重み付けのポイントは一番低くなっている。
この配置ルールこそ最初に統一すべきだ。なぜなら、配置ルールは他の評価軸と異なり、対象業務知識との関連は少なく普遍化し易いものだからである。
表記法の違いは論理的変換が可能であり直ぐに慣れるが、エンティティ数が多くなると配置ルールの違いを受け入れるのは困難が伴うものだ。
椿氏は当初からこの配置ルールを非常に重要視し、縦横2次元にどう配置すれば誰もが同じ表現ができ、かつモデルが読み易くなるかを熟慮して、エンティティの粒度で上下、イベントの生成タイミングで左右の配置を決めている。こうすることで、エンティティの追加や変更に応じて大きく配置が変わってしまうようなこともなく、より普遍的な配置が可能となる。
私も実践経験上、データは上から下に、時間は左から右に流れる配置ルールは合理的かつ自然であると感じており、この配置ルールこそは早く世界標準になって欲しいと願っている。
データモデルが普及して半世紀にもなるが、多くのモデリングの専門家が各自の配置ルールの優位性を主張していて、統一する努力を怠っている状況は許されないことだろう。
新たな時代に向けて
データマネジメントという膨大な知識領域の中で中核をなすデータモデルの位置付けが、近年低下している様に感じられるが、50年前も現在もその必要性は不変である。
年々複雑・大規模化する情報システムを開発・維持・活用する上で、データマネジメントの必要性と重要性もますます高まっていく中で、データモデルはより欠かせないものとなっている。
DOAの新たな時代を実現するには、情報システム部門の人材を育成し、サイエンスとしてのデータモデルを活用して組織的にコミュニケーションできるようにしなければならない。
情報システム構築には、情報システム部門、システムのユーザ、システム構築SIerなど多様な分野の参画が必要であり、かつ同時にそれらの人がデータ要件として目指すデータモデルを正しく認識し、組織的な共有ができなければならない。
このような状況が生まれることで初めて、半世紀のDOAの歴史を超えるような新たな展望が開けるだろう。
先人がDOAの原理を確立し、その方法論も実践の中で研かれている。それを適用する上で失敗することはなく、成功が保証されているといえる。 半世紀の実践と知恵が蓄積したデータモデルを、今こそ武器として活用せずに情報システムを構築することは許されないだろう。