メタファインド
天気予報では「もう冬の寒さ」と伝える日が多くなり、外出せずに家で映画を観ることが増えてきた。久しぶりに「2001年宇宙の旅」を観た。人工知能の「HAL」が意思を持ち、乗組員の生命維持装置を切るなど、背筋がぞっとする展開になる。1968年アメリカ公開の映画で、当時は未来の空想話であったかもしれないが、今は身近に感じる話題になってきた。
ところで、メタファインドという社名は、「無意味に並べられたデータや世の中の事象から、何を意味あるものとして認識すべきか、“概念”を見つけ出す(≒メタデータを見つけ出す)」ことを生業にしたいとの思いで命名された。
このところ、AIやIoTなどがビジネスの重要な位置を占めつつあり、すでに構造化データと非構造化データを統合すべき時代になっている。
構造化データのモデリングでは、業務で扱われる画面・帳票のデータ項目名やKEY項目名が手掛かりになり、比較的容易にエンティティ名を抽出することができた。エンティティ名は業務を行う人々が興味を持つ、実世界の“概念”であった。
一方で、非構造化データのモデリングでは、わかりやすい手掛かりが無い。その対象は、SNS上のテキストの羅列、マシンから導き出される一見意味のない信号、画像のようなドットの集まりである。これらのデータを業務で利用する際には人間が意味を理解しなければならないので、その時にはなんらかの“概念化”“構造化”が必要となる。(まさに、メタファインドの出番である(笑))
非構造化データから“概念”を見つけ出すには、その対象データから何を読み取りたいかを決めなければならない。そのとき重要な役割を果たすのは“言葉”である。構造化データのモデリングではエンティティ名がその役割を果たしたが、エンティティ名のような“メタデータ”が非構造化データのモデリングでも必要となる。
構造化データと非構造化データの両方で扱われる、人間が理解したい“概念”を、“言葉”で整理する手法が求められている。(従来からあった手法と区別するために、一旦、タクソノミーモデリングと我々は呼んでいる)。単に洞察力に頼るのではなく、一定のスキルさえ身につければ、誰でもモデリング可能な手法を開発したいと考えている。
最後に、
今年の夏面白い記事があった、「フェイスブックが、2つのAIチャットボットが独自の言語で会話し始めたのでそれらをシャットダウンした。」というものだ。
トレードに関する“言葉”を教えていなかったので、チャットボットが自分達で“言葉”を作ったらしい。
IoTの世界では、マシンからマシンへデータが流れることも多い。人間が理解する“言葉”で会話されるのではなく、マシンが新たな“言葉≒概念”を作り出して会話する世界が来るのだろうか。
そんな時代になっても、メタファインドの出番があってほしいと空想話を楽しんでいる。