ついに姿を現すOceanProtocolの新規軸Compute-to-Dataとは?
プライバシーを守りながらプライベートデータを売買する
著:OceanProtocol Japan
Compute-to-dataは、プライベートデータの活用によるメリットと、その公開により生じるトレードオフの課題を解決します。
データをオンプレミスで維持しつつ、第三者はそのデータに対して特定の計算ジョブを実行し、平均値の算出やAIモデルの構築といった有用な計算結果を享受することが可能になります。
世の中で活用されるあらゆるデータの中でも、最も価値のあるデータはプライベートデータであり、このデータを有効活用することで医療研究やビジネスの効率性を飛躍的に向上させることができます。一方で、プライバシーデータの中身、つまりその内容に対するプライバシーやデータの管理手法には複数の課題がある為、そのアクセスは困難を極めます。
そこで、Oceanが提供するCompute-to-Dataでは、プライベートデータを直接共有するのではなく、プライバシーを保護する特定のアクセス権を付与する形を取ります。
これにより、各種研究分野でのデータ共有や、厳格なプライバシー保護が必要なプライベートデータの売買を行うマーケットプレイスなど、企業や組織がデータ資産の安全性を確保しながら収益化する機会として活用することができるようになります。
プライベートデータは、各種研究分野において未来の社会を一変させるような革新をもたらします。例えば、より正確な個々のデータが増えれば、最新の人工知能(AI)モデルの機械学習に利用する事ができ、その学習精度が飛躍的に向上します。この貴重で有用なデータ資産の安全な利用プロセスを提供することは潜在的に非常に大きな収益化の機会の創出につながり、Oceanは以下の要素を有効かすることでそれを実現します。
- コントロール権
データ内容は外に出ない為、データの所有者がデータを管理できます。 - 巨大なデータセット
データ所有者はデータを移動することなく、データの共有や販売を行うことができます。これは、データの移動や転送に時間や費用がかかる大規模なデータセットに最適です。 - コンプライアンス
データ内容の利用を提供しながらも、データ自体を移動しないことでGDPR等のデータ保護規制準拠が容易になります。 - 監査可能性
Compute-to-Dataは、アルゴリズムが適切に実行されたことを証明するのでAIの実務者は結果の信頼性を確保することができます。
仕組み
データ所有者は、自分のデータ上でAIアルゴリズムを実行することを承認します。Compute-to-Dataは、データのプライバシーを保護しながら、AIモデルを学習するために、データ上での遠隔計算と実行を指揮することができる機能です。これはプライベートなデータは研究に役立ち、ビジネス、科学、テクノロジーの分野で人生を変えるような革新をもたらします。前述のように、より多くのデータはAIモデルの予測精度を向上させるからです。
Marketplaces
マーケットプレイスでは、ファイルのダウンロードによるアクセスに加えて、Compute-to-Dataを有効にしたデータセットの公開をユーザーに許可することができます。 Ocean Protocolのコアコンポーネントに加えて、Compute-to-Dataのインフラは、バックグラウンドでAWSやAzureなどのKubernetes(K8s)クラスターとして設定されます。このKubernetesクラスターは、マーケットプレイスのクライアントやエンドユーザーの目に触れないところで、実際のコンピュートジョブを実行する役割を果たします。
マーケットプレイスは、このK8sクラスター内でエンドユーザーに提供するコンピュートリソースを自由に選択でき、様々なイメージやリソースの中から選択することもできます。 同様に、マーケットプレイスは、マーケットプレイス内のデータセット上でユーザーに実行させたいアルゴリズムの種類を選択・制限することができます。
Set Up a Compute-to-Data Environment
Data所有者
Compute-to-Dataでは、データの所有者はデータセットを公開し、Compute-to-Dataを唯一許可されたアクセスメカニズムとして認め、価格設定することで、貴重な潜在的データの収益化を可能にします。また、Ocean Protocolの全てのデータセットと同様に、メタデータのみが公開され、データファイルへの参照は公開時に暗号化されることによりデータファイルの安全性が保たれます。
エンドユーザーは、計算ジョブのステータスと最終結果のみを取得し、データそのものを取得することはできません。
エンドユーザー
マーケットプレイスでのCompute-to-Dataにより、エンドユーザはプライバシーを守りながら個人データを売買することができます。エンドユーザーは、Compute-to-Data対応のデータセットを選択し、独自のアルゴリズムを実行することができます。その際、データファイルの復号化URLは、エンドユーザーやマーケットプレイスに公開されることはありません。
また、ユーザー自身がデータ提供者になることもできます。自分のデータが安全に保たれることが保証されていれば、個人データへのコンピュートアクセスを共有することに大きなインセンティブが生まれます。
アルゴリズムの信頼性
個人を特定できる情報(PII)の漏洩が無視できるアルゴリズムであるか、という狭い範囲での信頼のみが求められます。例えば、単純な平均化関数は、PIIを漏らさないように十分にデータを集約し、AIアルゴリズムも同様に情報を集約します。市場やデータ所有者は、どのアルゴリズムを信頼するかを選択します。したがって、個人データが流出するリスクを負うのも、どのアルゴリズムを信頼するかを選ぶのも、同じ主体です。それは、彼らのリスク・リターンの好みに基づいた選択となります。
プロヴァンス
全てのコンピュートジョブは、エンドユーザーがサービス実行コントラクトで許可されているかどうかを検証することから始めなければならないため、各コンピュートジョブはオンチェーンで記録されます。それはまた、ブロックチェーンベースのスマートコントラクトによって、全てのデータ提供者やAI実行者がアルゴリズムの適切な実行を検証できることを意味します。
以上の記載情報はOceanProtocolの公式Webサイトからの抜粋が主体となっております。Ocean MarketにおけるCompute-to-Dataの有効化は執筆時点でも間もなくであると発表されています。
データの中身を公開することなく計算・集計材料としてのデータ提供を可能にすることはデータ経済及びデータマーケットを発展させる上で必須事項であることは言うまでもありません。
と、同時にこれがこの分野におけるブレイクスルーを創出するきっかけとなる可能性を持っている素晴らしいソリューションです。OceanProtocolによる真のデータ経済の構築はまだ始まったばかりです。今後の情報をフォローしながら共に未来への道程を辿っていきましょう!
Compute-to-Dataリソース
Ocean Market
Use Ocean Market to buy & sell private data via Compute-to-Data.
Build & Launch
Build your own privacy-preserving data market, powered by Compute-to-Data.