定量的理念型データ

「我々はメタデータに基づき人を殺す」とは、元NSA長官のマイケル・ヘイデンス大将の言葉である。（著書：アルゴリズムが「私」を決める。WE ARE DATA　より）
注：NSAはアメリカ国家安全保障局の略称。
ある人物の行動パターンを表すメタデータが、“テロリスト”のそれと一致するとき、
その人物を無人攻撃機プレデターが爆撃する。
ここで言う“テロリスト”という類型を、この書籍の中では定量的理念型データと呼ぶ。
これは、DMBOKで言うところのリファレンスデータの一種である。
この話の怖いところは、事の真偽を判定するのが、データのパターンを見つけ出すアルゴリズムのみであるところだ。都市の郊外で多くの人が集まる結婚式が、さもテロリストの会合のようなパターンを作り出し、攻撃されることになる。

政府や企業は、それぞれの目的のためにこういった定量的理念型データとアルゴリズムを設計する。
「私」というデータは、私の意図と関係なく政府や企業によって生み出され、それぞれの目的で使われる。政府や企業が見る「私」は、真の私ではなく、データによって語られる「私」である。

ある企業が、ある人の発信するブログやSNS、購買履歴を分析して、
「この人物が、男性である確率90%、年齢が30代である確率80%、既婚者である確率0%、年収600万以上の確率50%、旅行好きの確率40%、・・・・」などと類型化したと仮定しよう。
ある時、この人物がゆりかごやオムツを買う。その後も、哺乳瓶の煮沸消毒機器などを買う。
購買パターンから「乳幼児を持つ人」と判定し、「既婚者確率も90%」に書き変える。
この人物の実際は、結婚もせず、子供を持つことになった姉のために購買を代行しているだけかもしれない。
しかし、ネット企業からすれば、事の真偽は最優先事項ではない。乳幼児を持つ人が次に買いそうな品物をリコメンドし、売上が伸びれば良いのである。
企業にとっては、「データは実世界の正しい写像である必要はない」のかもしれない。

我々は、自分がどのように分類され、どのように扱われているかを知らない。もちろん、私の個人情報として「それは間違いです、既婚者ではありません」などとクレームを言うこともできない。

写真も実世界の写像であり、一種の画像データである。我々は、被写体としての権利を持ち、自分が写った写真が新聞や書籍、SNS等に掲載される場合、拒否することができる。
使ったカメラや記録媒体が、カメラマンのものであったとしても。
同様にアルゴリズムによって読み取られた「私」というデータも、自分自身がコントロールする権利を持ちたい。
しかし、これには難しい問題が含まれる。

他人が自分のことを類型化することは制御できない。たとえば、「頑固者」「優秀な人」「けち」「子煩悩」「酒好き」など、他人は自分にさまざまなラベルを張り付ける。
政府や企業が我々を類型化することも、同様に制御できない。

しかし、彼らが勝手に作り出すデータは無理としても、私たち自身が彼らとの関係性の中で発生させたデータは、我々の意思でコントロールしたい。契約申し込み時に入力した住所、年齢、勤務先、年収、家族構成などは、当該契約の目的のみに限定し、他の目的で使われるときは、事前に承認する権利を行使したい。

「忘れられる権利」が認められるようになった経緯を考えれば、多くの定量的理念型データ
についても、その存在を知り・コントロールできるようになるかもしれない。EUで最近話題になったGDPRもその動きの一環であるし、クッキーの利用制限も同様だろう。

「私」を表すデータを、私自身に取り戻す動きは、今後も活発になるだろう。