ARTICLEFEATURE

「テクノロジーに基づく未来は予測できる」情報銀行、独自分散台帳技術、Scalar DLT

Feature

「情報銀行」の社会実装がいよいよ始まろうとしています。総務省及び経済産業省による合同での検討会を経て取りまとめられた「情報信託機能の認定に係る指針ver1.0」が公表され、情報銀行認定に関わる環境が急ピッチで整えられています。

そのような状況で、「Next Generation Database for xTech Infrastructure」を掲げる株式会社Scalar(以下「Scalar」)は、「分散台帳ソフトウェアを活用した情報銀行及びデータ活用事業者向けにソリューション開発に着手した」と発表しました。PLAZMAでは、20年に及ぶ先端テクノロジー領域とビジネスの越境から幅広い知見を有するScalar代表取締役CEO兼COO 深津 航氏に、情報銀行の社会実装により起こる変化と、それを支える技術的背景、また同社の提供するScalar DLTについて、インタビューを行いました。今回はその内容を構成してお送りします。

 

個人情報の取り扱い方が変わる、情報銀行の登場

「情報銀行(情報利用信用銀行)とは、個人とのデータ活用に関する契約等に基づき、PDS*等のシステムを活用して個人のデータを管理するとともに、個人の指示又は予め指定した条件に基づき個人に代わり妥当性を判断の上、データを第三者(他の事業者)に提供する事業」であると内閣官房IT総合戦略室では定義している(「AI、IoT時代におけるデータ活用ワーキンググループ 中間とりまとめの概要」)。
*PDS=Personal Data Store

具体的にはこうだ。情報提供事業者が情報銀行に個人情報を提供する際に、情報銀行側から生活者個人に対して、その情報の提供先や用途、またデータセットの非特定化処理方法などを確認する。それを受けた個人によって同意された情報が、提供先として指定された情報活用事業者に対して提供される。情報の第三者提供や又貸しを行うことはできない。つまり、生活者個人が自らの情報を、同意に基づいてコントロールできる機能といえる。

加えて生活者側から情報銀行へは、以下を実行できる機能を備える。

  • 情報の提供(同意)と情報提供の停止(同意の撤回)(コントローラビリティ)
  • 保有個人データの開示請求(コントローラビリティ)
  • 自らの情報の第三者提供履歴の閲覧(トレーサビリティ)

これらの機能を、操作が容易なユーザーインターフェースによって実現する。これが情報銀行に求められる役目となる。

「個人情報の取り扱い方が変わります」と深津氏は情報銀行の実装後の世界を語る。

深津 端的に言って、利用者にとってメリットのない情報の取り方は今後できなくなる。かつ自らの情報がどう使われているのかが重要になります。生活者が便益に対して同意をしない状態で情報をとってはならない、情報を取るのであれば便益とセットであるべき、というのが情報銀行の思想です。

個人情報保護委員会でパブリックコメントが11月に出て、2019年の3月を目処に認定が始まります。認定を受けていない事業者は基本的に信用できない、ということになります。もちろんいきなりの罰則規定はありませんが、段階的に厳しくなっていくでしょう。

現在、対個人を相手にしている一般事業者はおしなべて認定を取らないとビジネスが成り立たなくなります。(広告業界、DMP業界は)システムの作り直しを余儀なくされると考えられます。

情報の提供は、生活者にとって便益がなければならない

ここで、情報銀行が実装された生活の1シーンをより具体的に考えてみよう。

例えばある証券会社に行って口座開設をしたいケース。生活者が家財保険の契約において、情報銀行の認定を取っている保険会社に情報を預けているとすると仮定する。生活者は証券会社で本人確認をする際に、自分の情報を預けている保険会社(情報銀行認定事業者)から、口座開設に必要な情報を証券会社側に提供することで申し込みを行うことができる。保険会社側で何月何日に本人確認されているという情報が確認され、更にそのログに、その情報を確認した銀行などで再確認されたというデータが追記されるイメージだ。ユーザーインターフェイスは、例えばQRコードなどで認証を行うなど、なるべく簡易なものが求められる。

次に、データを受け取る事業者の場合。あるデータに、参照や受領、補足して追記するなどのニーズが発生した場合、情報銀行のデータセットを参照し当該データを指定すると、まず対象とする個人に同意確認のリクエストが行われる。該当個人から同意が認められたデータに関して情報銀行より提供を受け、しかるべき処理が行われる。データの指定は個別でも一括でも行われることが想定され、例えばモバイルにプッシュ通知が送られるなどで同意の有無を確認される、いわゆる随時確認の方法が取られる。

また、同意には事前同意と包括同意という方法も考えられている。事前に特定の情報と、情報を提供することに同意する事業者を指定しておくのが前者で、ある範囲やカテゴリの情報や、特定範囲の事業者であれば任意の情報を使って良いとするのが後者である。

そして、情報銀行では、個人情報を登録してもらって非特定化処理を行う。本人が推定されないようにするために、ある一定量のデータが集まらない場合にはデータセットは作らないなどの条件付けがなされ、作成されたデータセットは情報銀行に保存される。識別非特定情報および非識別非特定情報データの利用のリクエストがきたデータセットは、データの塊として渡し、その情報参照履歴が記録されることとなる。Scalarが開発しているのはこれらの個人情報のコントローラビリティの機能と、これらの利用履歴の記録によるトレーサビリティの機能だ。

独自の分散台帳ソフトウェア、Scalar DLT

情報銀行事業者は、預託された個人情報をコントローラブルにし、暗号化して格納、非特定化処理を行ったデータセットを登録しておく。データが外部事業者に渡った時には、書き換えられないログに記録してどの事業者にデータが渡ったのかを確実に記録することで、ユーザーに信頼性を担保する。そこで多数発生するトランザクション管理が、Scalarのターゲットとしている領域となる。

実際の流れはこうだ。生活者の氏名、誕生日、性別、住所など、個人情報を生データでScalarの分散データベースソフトウェアであるScalar DBに格納し、非特定化処理を行う。例えば氏名はIDに、性別はそのまま、誕生日は年代、住所は都道府県など。いわゆる「丸める」と言われる加工だ。これらをまとめてデータセットとし、要請に応じてデータの塊として外部事業者に渡す。トレジャーデータのArm Treasure Data eCDPとの連携もこの部分で想定されている。

それぞれのデータセットにはスマートコントラクトがあるので、外部事業者が勝手にプログラムを変更して個人情報の扱い方を改変しようとしても、承認者がサインアップしないとできず、記録されたログは改ざん検知機能を持つ。これを実現するのが、Scalarが提供する分散台帳ソフトウェアであるScalar DL。Scalar DBとScalar DLによって構成される、独自の分散台帳技術に基づくソフトウェアの総称が、Scalar DLTである。

情報のコントロールを個人に戻すために

Facebookによる個人データの流用による情報操作や大規模データ事業者の過度な囲い込みが問題となる昨今。情報銀行の実装によって既存システムは作り直しを余儀なくされる可能性が高いが、それでも情報銀行には取り組むべき価値があると、深津氏は考えている。

深津 会社の資産として取り上げられるのは、まずヒト、モノ、カネ。ここに「情報」が追加されました。その「情報」だけ、取り扱いが雑だった。「情報」の特性は、ひとつひとつ個別のデータの価値は高くありませんが、それが集まると急激に価値が高まります。

「情報」を武器にのし上がってきたのが、いわゆるGAFA(Google, Apple, Facebook, Amazon)。デジタルディスラプターとも言われています。ヨーロッパではそれに「NO」を突き出して、個人のデータは個人に便益が帰るようにしましょうと。それで始まったのがGDPRです。

日本でもそういった、データを囲い込みユーザーを囲い込むビジネスを防がないと、GAFAのような外国企業が日本人のデータを使って、日本でビジネスを拡大していってしまう。それに対応しなければならないということが、今回の情報銀行の大きな目的のうちのひとつです。

加えて、情報を握った会社が情報を出すことを拒否することを禁止しましょう、ということ。つまり情報の独占禁止、コントロールを情報の発生元である個人に戻せということが、GDPR並びに情報銀行の基本的なコンセプトです。つまり、「情報は誰のものか」ということ。情報をコントロールできる権限が個人に戻るということです。

現実的にその統制は可能なのか、という問いもありますが、私は可能であると考えます。なぜなら、ヨーロッパではもう始まっていますからね。

フロントデバイスが数百億台を越えてくる未来

Scalarのテクノロジー的な立ち位置を考えるにあたり、下記のようにフロントデバイスとデータベースの関係性の現在と過去、未来を俯瞰する必要があると深津氏は説明する。

過去、PCの時代。デスクトップやラップトップコンピュータとRDBMS(リレーショナルデータベース管理システム)はアプリケーションやミドルウェアでやり取りを行っていた。クライアントの端末台数はおよそ数千万台で、常時ではなくアドホックに接続されている状態。

現在、クライアントの端末としてスマートフォンが登場してきたことで、数十億台のデバイスがリアルタイムに常時接続される状況となった。よりアプリケーションに近い領域で処理を行う必要が出てきたことから、リクエストごとにRDBMSに書き込みを行っていては処理が追いつかないため、RDBMSとクライアントの間に新たなデータベースのレイヤーが生また。さらに、データ構造の変化が早くなり、SQLに代わって「JSONとREST」というより柔軟な連携方式が生まれ、これに適合するNoSQLが誕生した。ただし、決済や契約などの重要な処理は、RDBMS内に構築され、これと連携している。

そして近い未来。IoTの時代となり、クライアントのデバイス数は数百億台以上に増えると考えられている。クライアントの種類もスマートフォンに加え、ウェアラブルデバイスや工場、自動車やバイクなど、あらゆるものがコネクテッドになり、通信方法もアクティブな常時接続に変化する。エッジコンピューティングが始まり、デバイスの内部で、それを受け取るアプリケーションとデータベースが閉空間において動作する。

サービスやユーザビリティの向上を目的とし、スマートフォンやウェアラブル系のアプリケーションとデータベース、いわゆるNoSQLと、センサー由来のデータベースを連携することが求められるため、トランザクション処理も行うことができるデータベースのレイヤーが新しく生まれる。このトランザクション処理は、よりクライアントに近い領域でクライアント同士をつないだインターネット上で行われるため、プログラムやデータの改ざんに強いデータベースが必要になる。「分散した状態で自律的にトランザクションをアサインする」(深津氏)ことが求められる。そのバックには更にアプリケーションが複数立ち上がり、APIを介してNoSQLやRDBMSがある。そして、それぞれが相互に連携する。

Scalarの立ち位置は、その新しく生まれるトランザクションを管理するデータベースの領域だ。なぜならば、そこはインターネット上、つまり外部環境に晒されている領域であるため、不正アクセスが起きやすい。特定のサービスと連携し契約行為を実行しているため、強固な耐改ざん性が求められ、また複数のレコードを非同期で連携するトランザクション管理機構を有することが必須となる。つまり、小さくて大量の独立したトランザクションを多数処理し、かつこれらの処理に不正な改ざんを防ぐ仕組みが必要となる。深津氏率いるScalarはそれを、いわゆるブロックチェーンではない独自の分散台帳技術で設計、構築している。

システムを信用する世界へ

Scalar DLTのテクノロジーを説明する前に、「信用」について、深津氏は触れた。なぜ信用が論点になっているのか、現代における2つの課題をまず挙げておきたい。

ひとつは、企業のサービス提供において、チャネルの大きな変革が始まるということ。企業の販売や営業活動において多く用いられている対面というチャネルの占める割合が減る。労働人口がシュリンクすることでそのチャネルに人員をアサインして、直接生活者に説明をしたり信用を勝ち取ったりして営業、販売を行う、という行為が困難となる。

もうひとつは生活者側の行動から。10代〜20代の人たちが、情報が氾濫する現代において、広く頒布される情報を信用しなくなっていること。彼ら彼女らは、自分が信用している人が発信している情報しか信用しない。企業は単にホームページを開設してWebに情報を出してマスで広告を打っても、信用されない、売れない時代になっているのだ。

販売、営業チャネルに人を介在させる事ができず、広告で届けても裏付けのない情報であれば信用されず価値を持たない。では誰がその信用を裏付けし価値を担保するのだろうか?

「システムを信用します」と深津氏は言う。

例えば、決済の歴史を鑑みると、人類が欲するモノの中間に貨幣を置き、それを信用して取引するということから、中央銀行が設立されて、国をまたがった取引についても貨幣に信用を与えて可能にした。20世紀にはクレジットカードが生まれ、販売者はカード会社を信用し、カード会社は個人を信用することで決済が成り立つようになった。ここにおいて、それまで相互に信用することで成り立っていた取引、決済の信用の流れが、「販売者→カード会社→個人」という一方向に変化した。

そして次に来たるべきもの(今すでに来ているもの)、それがシステムを信用することで価値が成り立つ世界だ。現に販売者も生活者も、システムを信用することで、トークンだけで価値の交換ができる時代。ではその信用は誰が担保するのか。「信用を分散する」という思想に基づいているのが、ブロックチェーン、分散台帳技術である。

ブロックチェーンにはパブリック型(中央集権的な管理機関が不在)とプライベート型(管理者もしくは管理機関が存在する)がある。Scalarが構築する分散台帳技術のベースとなるのはプライベート型。

深津 信用という話には、ビジネスとシステムの観点があります。

ビジネス的な思想としては、ある程度信用のある会社がお互いに契約行為に紐付いていて、さらにそれら複数の会社が共同運用するプライベート型のブロックチェーンを想像すると、その中の誰かが裏切ると他に波及する。だからみんなが正しい方向に戻そうとするインセンティブが働く。極論、1社1社は完全に信用できないとしても過半数が裏切ることはないだろうというのが、信用を分散するということです。

システムの観点からすると、ブロックチェーンの技術の中で革新的なのがスマートコントラクト(第三者を介さずに信用が担保されたトランザクションを処理できる特徴がある)。プログラムが書き換えられないというのが重要です。

例えばプログラムを書き換えて自分に便益をもたらしたい場合、システムを維持したまま特定の一部だけ書き換えたいというのが最も効果があります。けれども今我々が開発している技術はデータベースを一から全部を書き換えない限り書き換えが完遂されない。もちろん全部書き換えれば改ざんは可能ですが、それは即ちシステムの崩壊を意味します。結果便益は得られません。非常な悪意があって、データセンターを破壊すれば可能ではありますが、世界中のデータセンターで展開されている場合は、同時に全てを破壊する必要があるわけです。

テクノロジーに基づく未来は予測できる

Scalar DLTがブロックチェーンとは異なる設計思想に基づいている技術であるとは先に記した。深津氏はブロックチェーンの課題について以下のように認識している。

深津 ブロックチェーンとは何かというと、トランザクションの塊があって、それをブロックにまとめてチェーンしている。そのトランザクションがある程度集まるまでは、次のチェーンに進めません。

私たちがこれから直面するであろう世界は、大量のトランザクションが同時多発的に多数実行されるはずです。それぞれは多対多の取引なので、トランザクション同士はほとんど競合しないのですが、競合することもあるため整合性は求められます。トランザクション数が増えていった場合、ノード数を増やして、スケールしないといけない。ブロックチェーンでは、設計上それが頭打ちになってしまうアーキテクチャなので、ビジネスが成功し、拡張した時に失敗する。私たちが設計しているScalar DLTはそれを回避し、スケーラビリティを保証するソフトウェアです。

Scalar DLTの分散台帳技術の特徴として挙げられるのは、分散データベースの上にトランザクションを載せている点だ。複数のノードに同時に書き込む、マスターを置かない分散データ管理の方式を取り、それぞれのトランザクションをチェーンさせることで、改ざん耐性(改ざん検知)を確保している。トランザクションをまとめたブロックとしてチェーンさせないので、スケールも容易になる。深津氏によれば「ブロックをまとめていないので、そういう意味ではトランザクションチェーンとも言えるのだけれど、そういう用語はないので」Scalar DLTは「独自の分散台帳ソフトウェア」と現時点では表現している。

また、ノード間の通信を最小限に抑える仕組みを実装することで、ノード数が増えてもネットワークの飽和を回避し、システム全体の効率性を高めている。さらに、多数のノードのデータの自動バックアップと簡単なリカバリの仕組みを現在開発中である。

深津氏は、数十億台から数百億台のデバイスがクライアントとなり、それぞれがインタラクティブに連携する未来を「3年では起きないが5年くらいでは起きる」と見ている。その未来において、Scalar DLTは新しく生まれる領域をカバーする。

「テクノロジーの世界はインクリメンタルな世界だから、突発的に飛び越えない。だから予測できるんです」と深津氏は語る。「テクノロジーに関しての研究やイノベーションが常にインクリメンタルで行われていて、ジャンプアップはないんです。でもみんな、知らないからジャンプアップに見えているだけですよ」。

Scalarは3.0億円のシードラウンドの調達を完了。三井住友海上保険株式会社、三ッ輪産業株式会社、そしてLINE株式会社などとの協業を進めている。深津氏の見据える未来は、すぐ手の届くところに近づいている。

(text by Ippei Hosokoshi)

Show More
Close