このブログでは、ゲノムや医療診断などの大量のデータベースを分析して新しい発見を生み出す方法に関連する研究をご紹介したいのですが、どうしても予備知識が必要になります。
次に紹介したい発見はScientificDaily NewwのFinding simplicity within complexityという記事なのですが、これを説明するためには、私達が人工知能と呼んでいる技術がどのような特性を持っているかをお話しする必要があります。
それで今回は、「ニューラルネットワーク自作入門」という本をベースに、代表的人工知能である教師あり機械学習が何をしているかについてお話します。
人工知能というと、ヒトの顔を判断して、人物を特定する仕組みを想像されると思います。
実は人工知能と言われる仕組みにも多数あって、教師なし機械学習と言われるプログラムは、とってもわかりやすいものです。短く言うと、データの中から区別しやすい指標を見つけるということです。例えば、受付に来られたヒトの性別を判断するためには、大量のデータを利用することができます。顔の輪郭や服装、声の音質などがそれらにあたります。でも、最も正確に判断したいと考えると、受付時の質問用紙に性別の記入欄を設けておいて、それを読み取ってできるデータ(これを指標といいます)が最も正確です。
ちょっと例えがおかしいと感じたかもしれませんが、データというのは、そのような多様な性質や入手の難易度などを持っているものです。その中から、最も正確性が高い指標やその組み合わせを探し出すのが、対象を分類して区別するのに有効です。このような分類方法を見つける手段が教師なし学習です。
それに対して、手書きの文字を読み取ったり、顔の判別をしたりする場合は、もっと複雑です。多くの場合対象の持っている指標を単純に組み合わせて判断をすることができません。
それで、パーセプトロンという小さな判断プログラムを組みあせます。この判断プログラムには、データが持っている1つか2つの指標を入力します。すると、パーセプトロンは設定値に応じて答えを出します。その一つ一つのパーセプトロンは手書き文字の示す数字などの最終的な答えを出すことはできませんから、連結させます。このパーセプトロンが層状に連結している、多層パーセプトロンは複雑な判断にも対応するようになります。パーセプトロンの一個一個は単純な判断だけをしますが、それらを連結しますと、複雑な分類にも対応するようになります。ここで、パーセプトロンの一個一個の判断基準は、単純な、重みや出力先などの設定をだけで成立しています。多層パーセプトロンで各パーセプトロンの重みや出力先を調整して、最も良い数字を見つけることができると、一つの対象の分類が可能になることは想像できると思います。犬と猫のイラストがあって、耳の形や鼻の形などを数値にして入れると正しく犬か猫を選べる設定値があることは想像いただけると思います。
一枚の犬か猫のイラストについてパーセプトロンごと重みや出力先を工夫すると、犬か猫を正しく判断できるようになるのは想像いただけると思います。
続けて、イラストをいくつか試すときにも、一個のサンプルと同じように重みや出力先を変更すると、犬か猫が正しく判断できます。ただし、たくさんのイラストで判断するときに、重みや出力先の設定値はパーセプトロンごとに違っても良いけれど、イラストごとに変更してはいけないとします。かなり大変になりますが、もしかすると、いろいろなイラストで犬か猫を正しく判断できる設定値が存在するかもしれません。正しく判断できる重みや出力先のセットを探すためには、毎回、イラストの正しい答えを見ながら調整します。
そんな、パーセプトロンの重みや出力先を見つける作業が 教師あり機械学習です。
出来上がった、パーセプトロンの重みや出力先のセットは、多くの場合、これまでに使っていなかったイラストを持ってきても正しく判断する可能性比較的高いと思いませんか?
例えば、1万枚のイラストで調整したパーセプトロンの重みや出力先のセットは10,001枚目のイラストについても正解を出しそうです。
ただ、想像いただけると思いますが、こうやって正解率を高くした多層パーセプトロンは、たくさんの重みや出力先を数字として持っていますが、人間が理解できるような、単純な指標の組み合わせは教えてくれません。あるのは、ただただ、たくさんのパーセプトロンについている設定値だけです。
結果的に、教師あり機械学習は、多くの対象を区別可能にしてくれますが、その区別方法を人間が「理解できる」ような法則にしてくれることはありません。
これが、今社会で使われている人工知能の特徴です。
つまり、人工知能が優秀でも、人工知能に「どうやって区別できたの」「どう理解したの」と尋ねることは、全く無意味なのです。何千ものパーセプトロンの設定値を答えてもらっても理解したとは言えませんね。
結局「人工知能は理解しない」と考えるのが最も有効な考え方です。
ニューラルネットワーク自作入門 単行本(ソフトカバー) – 2017/4/28
Tariq Rashid (著), 新納 浩幸 (監修, 翻訳)
出版社 : マイナビ出版 (2017/4/28)
発売日 : 2017/4/28
言語 : 日本語
単行本(ソフトカバー) : 272ページ
ISBN-10 : 4839962251
ISBN-13 : 978-4839962258
0 件のコメント:
コメントを投稿