blockchainjapan’s blog

旬のブロックチェーンを記事を厳選して提供!

データの民主化:HUMAN Protocolが世界にとって重要な理由


データの民主化:HUMAN Protocolが世界にとって重要な理由

著:Charlie Child

“ソフトウェアは単に人間の思考をコード化したものである” — Chris Dixon

一般的には気づかない事かもしれませんが、人工知能製品を取り扱う為には何十万、いや何百万ものデータラベラーの目に見えない労力が必須となっています。

従来、AI製品はGoogleAppleFacebookAmazonGAFA)により作成され、製品の「知能」を訓練するために使用するデータは、それぞれの企業のサイロ内に独占・集約され続けていました。GAFAは、何十億人ものユーザーに集中的サービスを提供し、生成データを収穫してAI製品を訓練しています。GAFA以外の機械学習実践組織にとっては、トレーニングと品質管理の両面で必要十分なデータにアクセスすることは非常に困難です。

HUMANプロトコルはデータを民主化します。誰でも、世界中で数億人にのぼる分散型Laborプールに対してデータのラベリング作業を依頼することができます。世界最大のアクセス可能な労働市場であり、これらは全てソフトウェアにより運営されています。

私たちは、機械訓練の為に使用するデータに注意する必要があります。データが単一の企業のサービスにより集められた偏ったデータ、つまり多様性を有する適切なデータではない場合、そのデータを用いて訓練されたAI製品は意図しない結果をもたらす可能性があります。

この記事では、分散化されたパーミッションレスでオープンなプラットフォームを通じて、HUMANプロトコルがどのようなソリューションを提供するのかについて見ていきます。

なぜ企業はより多くのデータを必要とするのか?

プロジェクトに関わる人が多ければ多いほど、適切なコンセンサスを決める事ができます。1000万ものデータポイントから学習するAIアプリケーションは、100万のデータポイントしか使わないものよりも、より良い製品を生み出す可能性が高くなります。これは、MLがパターン認識の一形態であるためで、データが多ければ多いほど、そのパターンはより正確になります。

したがって、データに関しては量はそれ自体が品質なのです。

データのラベリングとは、人間がある単語と生データの間に関連付けを行うことを意味します。

例えば、ある一人のベテラン医師が皮膚の画像上の癌の成長をラベリングして欲しいという依頼を受けたとします。この医師が主に白人の患者を扱っていて、そのせいで有色人種の皮膚癌の兆候を明確に判断できないとしたらどうでしょうか?彼の認識バイアスはデータに刷り込まれ、それがアルゴリズムにフィードバックされます。さて、この世界中のテクノロジーを凝縮させた「先進的な」AI医療製品は、白人以外の皮膚がんを認識できずに見逃し続けます。機械学習においては。この点を十分に把握しておかないといけません。

そのデータにより成長を遂げた製品ははそのデータと同じくらいしか優れていないという事です。

もちろん、この問題の製品がその後試行錯誤を施され、モデルを改善していくことで解決されることは期待できます。しかし、完全な改善の保証はありません。実際、データの質と量に限界がある状態が続くと、AIモデルが過去のデータに働きかけ続けるため、バイアスを悪化させる危険性があるのです。

こうしたデータの問題に関しノースカロライナジャーナルにこのように記載されています:
“開発競争により目先のパフォーマンスばかりに注目して作成された製品は、この分野全体に余計な精査と統計をもたらし、堅牢なAIシステムの開発と発展を遅らせる可能性があります。”

HUMANプロトコルはラベラーの量の増加に焦点を置いているので、どんな偏見や地域特性もアルゴリズムとその量及び多様性により緩和されます。得意な偏見はデータからより広いコンセンサスを得る過程で外れ値となり、無視される可能性が高くなります。コンセンサスはバイアスを緩和することができますが、参加者が社会の多様な断面を形成している場合に限ります。

これこそが、世界最大の分散型労働力プールへのHUMANのアクセスが真のソリューションを提供するという文脈につながる事実なのです。

HUMANは、AIが直面する全ての問題を解決する銀の弾丸ではありません。しかし、オープンで透明性があり、公平な基盤を提供し、企業がデータ慣行を改善するための選択肢とインセンティブを確実に提供します。これにより初めて、データプラクティスが改善され、全ての人にとってより公平な未来を創造することができるのです。


HUMAN Protocolリンク集

Website / Twitter / Medium / Telegram / LinkedIn / Github

日本版コンテンツはこちら:Twitter / Medium