ニューラルネットワーク:HUMAN-in-the-Loopシステムが必要な理由
MLアルゴリズムの訓練用データラベルの需要が増加していることから、生データにラベリングするように設計されたAIソフトウェア製品の数も増えてきています。この記事では、モデルが動作するニューラルネットワークが直面している課題に注目し、HUMANのシステムが現在どのように質の高いデータを提供し、ニューラルネットワークと協力してMLアルゴリズムを改善してラベリング能力を向上させることができるかを見ていきましょう。
マルチモーダルニューロン — Open AIのCLIP
マルチモーダル・ニューロンは、あるものに対して一つの脳のニューロンが複数のクラスにまたがり活性化することで発生します。有名な話では、「ハレ・ベリー」ニューロンは、写真でもスケッチでもハレ・ベリーという単語に対しても人間の脳内で同様に活性化します。
Open AIは、彼らが有する広大なニューラルネットワークのCLIPにおいて、同じ「マルチモーダルニューロン」の働きを発見しました。
しかし、まだ問題があります。これが示すように、いくら進歩しているとはいえ、ニューラルネットワークラベリングソフトウェ アは以下に示すように、単純なイレギュラーな攻撃に対して非常脆弱です。重要なのは、CLIPは現段階では単に研究目的で使用されているだけであり、この問題はコンピュータラベリングソフトウェアの典型的な現象であるということです。
Open AIが投稿でこのように説明しています:
“テキストをつぶさに読み取るモデルの能力が機能することで、手書きのテキストが貼られた写真によってモデルを欺ける事がわかります。”
問題は、複雑な人間の神経学的機能を「マルチモーダル・ニューロン」という言葉に人工的に抽象化してしまったことです。MLが神経科学からインスピレーションを得ることは間違いなく価値のあることですが、このようなシステムが容易に攻撃されてしまうという事は、ニューラルネットワークを過大評価しないようにするべきであるという事と、人間が持つ直感の価値を理解するべきであるということを思い知らされます。
線形 vs 拡散
この様な単純攻撃はいづれ解決されるかもしれませんが、他の種類の攻撃が存在することも間違いないでしょう。
問題は、人間の心の働き方に直線的な抽象的接続を適用しようとする事にあります。
なぜなら、人間の本質は、コンピュータが依存している単なる言語化という直線性を超えた、複雑な意識の質によって形成されているものであるという部分にあります。人間が、「犬」という言葉を知っているから犬やリンゴを区別できているのではなく、読み書きを知らず、それらの呼び名を知らなかったとしても、その物事の本質が異なることは理解するでしょう。絵の中に 2 つの別個のものがあり、1 つはリンゴとして区別され、もう 1 つはポストイットに書かれたメモ付きのリンゴだったとして、それが同じ物体(リンゴ)であることは単純な直観で知ることができます。
HUMAN-in-the-Loop. 競争ではなく協力
コンピューターによる「意味」の導出能力は向上していく事は間違いありません。データの増加、そしてアルゴリズムの構造化の方法が改善されることで促進されていくでしょう。一方で、注意しなければならないことがあります。
現在、HUMANのテクノロジーは世界最大の労働力を利用するものとして機能していますが、このソフトウェアは人間と機械の両者に適用することができます。機械は必要なデータを把握していて、それを要求することができます。その要求(質問の形で)が、現在のように人間に送られるのか、将来的には高度なソフトウェアラベリング製品に送られるのかは関係ありません。
HUMANプロトコルは、AIを始めとする機械学習領域の成熟に向けて、データソリューションが取引されるマーケットプレイスの創造に力を与え続けていくでしょう!