◼︎人工知能は人間を超えるか 松尾豊

◼︎
冷静にみたときに、
人工知能でできることはまだ現状限られている
基本的には決められた処理を決められたように行うことしかできず、
「学習」と呼ばれる技術も、決められた範囲内で適切な値を見つけ出すだけだ
例外に弱く、汎用性や柔軟性がない
ただし、「掃除をする」「将棋をする」といった、すごく限定された領域では、人間を上回ることもある

◼︎
「音声認識」「文字認識」「自然言語処理(かな漢字変換や翻訳)」「ゲーム(将棋や囲碁)」「検索エンジン」などは現実社会に大きなインパクトを与えているし、日常的に使われている
これらはかつて人工知能と呼ばれていたが、実用化され、一つの分野を構成すると、人工知能と呼ばれなくなる
これは「AI効果」と呼ばれる興味深い現象だ
多くの人は、その原理がわかってしまうと「これは知能ではない」と思うのである

◼︎
生物に知能があるのも、人間に知能があるのも、「行動が賢くなると生き残る確率が上がる」という進化的意義によるものであろうから「入力に対して適切な出力をする(行動をする)」というのは、知能を外部から観測したときの定義として有力といえる

◼︎
機械学習は、
荷物サンプルと荷物のとこに注意するかを教えてあげなくてはいけない

ディープラーニングは、
何に注目するかも自分で学ぶので、
学習用の荷物サンプルを与えるだけでよい

◼︎
ワトソンの性能がどれだけ上がったように見えたとしても、質問の「意味」を理解しているわけではない
コンピュータにとって、「意味」を理解するのはとても難しい

◼︎
コンピュータが知識を獲得することの難しさを、人工知能の分野では「知識獲得のボトルネック」という

◼︎
フレーム問題は、人工知能における難問のひとつとして知られている
フレーム問題は、あるタスクを実行するのに「関係ある知識だけを取り出してそれを使う」という、人間ならごく当たり前にやっている作業がいかに難しいかを表している

◼︎
フレーム問題と並んで、人工知能の難問のひとつとされるものに、シンボルグラウンディング問題がある
記号(文字列、言葉)をそれが意味するものと結びつけられるかどうかを問うものである

◼︎
機械学習は、大きく「教師あり学習」「教師なし学習」に分けられる
「教師あり学習」は、「入力」と「正しい出力(分け方)」がセットになった訓練データをあらかじめ用意して、ある入力が与えられた時に、正しい出力(分け方)ができるようにコンピュータに学習させる
一方、「教師なし学習」は、入力用のデータのみを与え、データに内在する構造をつかむために用いられる
データの中にある一定のパターンやルールを抽出することが目的である
全体のデータを、ある共通項を持つクラスタにわけたり(クラスタリング)、頻出パターンを見つけたりすることが代表的な処理である

たとえば、あるスーパーマーケットの購買データから、遠くから来ていて平均購買単価が高いグループと、近くから来ていて平均購買単価が低いグループを見つけることが、クラスタリングである
また、「おむつとビールが一緒に買われることが多い」ということを発見するのが頻出パターンマイニング、あるいは相関ルール抽出と呼ばれる処理である

◼︎
機械学習によって「分け方」や「線の引き方」をコンピュータが自ら見つけることで、未知のものに対して判断•識別、そして予測をすることができる
しかし、機械学習にも弱点がある
それがフィーチャーエンジニアリングである
つまり、特徴量の設計である
特徴量というのは、機械学習の入力に使う変数のことで、その値が対象の特徴を定量的に表す
この特徴量に何を選ぶかで、予測精度が大きく変化する

機械学習の精度を上げるのは、
「どんな特徴量を入れるか」にかかっている

◼︎
人間が上手く特徴量を設計すれば機械学習は上手く動き、そうでなければ上手く動かない
いままで人工知能が実現しなかったのは、「世界からどの特徴に注目して情報を取り出すべきか」に関して、人間の手を借りなければならなかったからだ
つまり、コンピュータが与えられたデータから注目すべき特徴や見つけ、その特徴の程度を表す「特徴量」を得ることができれば、機械学習における「特徴量設計」の問題はクリアできる

◼︎
ディープラーニングは、データをもとに、コンピュータが自ら特徴量を作り出す
人間が特徴量を設計するのではなく、コンピュータが自ら高次の特徴量を獲得し、それをもとに画像を分類できるようになる

◼︎
データから概念を作り出すというのは、本来、教師データのいらない「教師なしデータ」である
ディープラーニングの場合、この教師なし学習を、教師あり学習的なアプローチでやっている
自己符号器は、本来なら教師が与える正解に当たる部分に元のデータを入れることによって、入力したデータ自身を予測する
そして様々な特徴量を生成する
それが教師あり学習で教師なし学習をやっているということである
ところが、少し理解が難しいのが、そうして得られた特徴量を使って、最後に分類するとき、つまり、「その特徴量を有するのはネコだ」とか「それはイヌだ」という正解ラベルを与えるときは、「教師あり学習」になることだ
「教師あり学習的な方法による教師なし学習」で特徴量をつくり、最後に何か分類させたいときは「教師あり学習」になるのである

◼︎
「人間の知能がプログラムで実現できないはずがない」と思って、人工知能の研究はおよそ60年前にスタートした
いままでそれが実現できなかったのは、特徴表現の獲得が大きな壁となって立ちふさがっていたからだ

◼︎
自らの行動と結果をセットで抽象化することのメリットは、「まず椅子を動かして、その上に乗って、高いところにあるバナナを取ろう」というような「行動の計画」がたてられるようになることだ
人間は、(時には必要以上に)原因と結果という因果関係でものごとを理解しようとするが、それはつまり、動物として行動の計画に活かしたいからだろう
「なにかをしたからこうなった」という原因と結果で理解していれば、それらをつなぎあわせることで目的の状態をつくりだす「計画的な行動」が可能になる
「椅子を動かす」「椅子の上に乗る」などの行動と結果の抽象化ができていないと、椅子を動かしてバナナを取ることはできないのだ

◼︎
弾が前から飛んで来た時に(前提条件)
右に動いたら(行動)
スコアが上がった(結果)

◼︎
実は、世の中の特徴量と呼ばれるものには、「一連の行動の結果として世界から引き出される特徴量」も多いのである

◼︎
「人間と同じ身体」「文法」「本能」などの問題を解決しないと、人工知能は人間が使っている概念を正しく理解できるようにはならないかもしれない
どらえもんのように、人間と人工知能が全く齟齬なくコミュニケーションできるような世界をつくるのは、実際にはかなり難しい
また、人間の日常生活に相当入り込んでくるロボットでない限りは、「人間とそっくりな概念を持つこと」の必要性は高くない
それよりも、予測能力が単純に高い人工知能が出現するインパクトのほうが大きいだろう

◼︎
言語の果たす役割とも関係があるが、社会が概念獲得の「頑健性」を担保している可能性がある
複数の人間に共通して現れる概念は、本質を捉えている可能性が高い
つまり、「ノイズを加えても」出てくる概念と同じで、「生きている場所や環境が異なるのに共通に出てくる概念」は何らかの普遍性を持っている可能性が高いのだ。
人間の社会がやっていることは、現実世界のものごとの特徴量や概念を捉える作業を、社会の中で生きる人たち全員が、お互いにコミュニケーションをとることによって、共同して行っていると考えることもできる

◼︎
シンギュラリティというのは、人工知能が自分の能力を超える人工知能を自ら生み出せるようになる時点を指す
自分以下のものをいくら再生産しても、自分の能力を超えることはないが、自分の能力を少しでも上回るものがつくれるようになったとき、その人工知能はさらに賢いものをつくり、それがさらに賢いものをつくる
それを無限に繰り返すことで、圧倒的な知能がいきなり誕生する、というストーリーである

◼︎
私の意見では、人工知能が人類を征服したり、人工知能をつくりだしたりという可能性は、現時点ではない
夢物語である
いまディープラーニングで起こりつつあることは、「世界の特徴量を見つけ特徴表現を学習する」ことであり、これ自体は予測能力を上げる上できわめて重要である
ところが、このことと、人工知能が自らの意思を持ったり、人工知能を設計し直したりすることとは、天と地ほど距離が離れている
その理由を簡単に言うと、「人間=知能+生命」であるからだ
知能をつくることができたとしても、生命をつくることは非常に難しい
自らを維持し、複製できるような生命ができて初めて、自らを保存したいという欲求、自らの複製を増やしたいという欲求が出てくる
それが「征服したい」というような意思につながる

◼︎
古い産業が衰退し、新しい産業が生まれるということと、それらが本質的に提供している価値が増大し、生産性が向上しているということは矛盾しない
人が生まれ、そして死ぬということと、人間社会がよりよい社会になっていくということは矛盾しない