pikesaku’s blog

個人的な勉強メモです。記載内容について一切の責任は持ちません。

人工知能(AI)の勉強

まずはキーワードから

参考

Amazon CAPTCHA

AIの代表的なアルゴリズムとして3つあり(御三家)

エキスパートシステム
 人間の考え方をベースにしたAI
 事前に専門家が定義したルールから答えを導きだす。

遺伝的アルゴリズム
 ダーウィンの進化論がモチーフであるAI
 優秀な個体が子孫を残す
 優秀な個体を「よい答え」と見立て、進化の手法を用いて最適解を導きだす。

 ※進化の手法とは
  優秀な個体を交叉すると優秀な個体が生まれる可能性が高いという仮説を利用
 
 組み合わせ爆発を起こす問題について、速く回答を見つける事が出来る
 膨大な多次元探索空間から適切な回答を生み出す際に有用
 
ニューラルネットワーク

 人間や動物のニューロンの働きがモデル
 ニューロンは受け取った電気信号の量が一定値以上だと発奮して、次のニューロンに電気信号を送る。
 パーセプトロン→ネオコグニトロン→ディーブラーニング

機械学習とは?

人工知能における学習のこと
プログラム以上のことができるようになる為の学習
事前に組み込んだ思考を調整し、事前に決めてある知識の型で知識を蓄積することで学習する。
→新しい思考、知識を生み出すものではない。

関連キーワード

教師あり学習
 例題と模範解答のセット(教師信号)が必要。
教師なし学習

強化学習とは?

人工知能が属する環境で試行錯誤を繰り返し最適な行動をみるける学習
行動と状況の表現、行動した結果の認識が重要
結果の認識は、「報酬」を定義することで決定
学習対象がモデル化できない場合に効力あり。

IBM Watson

自然言語に特化した人工知能
Wiki等の自然言語のデータ群から語と語の相関を学習
データ群をコーパスと呼ぶ
相関は2つの語が同一文章内で出現する頻度をベースに算出される
Pepperやサポートオペレーターシステムで活用されている

AlphaGo

DeepMind社が作った囲碁AI
囲碁はチェスや将棋よりも候補手が多く、評価関数を作るのが難しい
モンテカルロ木探索とディープラーニングを組み合わせた人工知能

ディープQネットワーク

ディープラーニングと強化学習の一つであるQラーニングを組み合わせた技法
DQNと呼ばれる
DQNを用いたゲームAIは、ルールは知らずに入力と結果を繰り返し学習し適切な選択を導きだす。
DQNは汎用的な状況判断の仕組みとして活用できる可能性がある。

パーセプトロン

脳の働きを数学的なモデルにしたもの
・1つのニューロンは複数の電気信号を受け取り、それぞれの量を判定して発奮するか決める。発奮したら、次のニューロンに電気信号をおくる。
・同じ条件で発奮するニューロン同士の結合は強化される(ヘッブ則)
電気信号を0,1に置き換えている。

ニューラルネットワークの元祖
入力と出力の2層の構成
 Input1-|
 Input2---Output
 Input3-|

 各Inputの重みを調整することで学習していく。
 これでも簡単なルールなら学習できる

ディープラーニングはこの層をたくさんにしたもの
 Input1~3-Output1-|
 Input4~6-Output2---Output
 Input7~9-Output3-|

ヘッブ則

シナプスの前と後で同時に神経細胞が発奮すると、そのつながりが強化される。
例)
様々な役割を持ったニューロンがある。
赤い色だけに発奮するニューロン
丸い形だけに発奮するニューロン
酸っぱさに発奮するニューロン

「梅干し」をイメージすると上記3つのニューロンが同時に発奮する。
これらのニューロンの結合は太くなる。

シグモイド関数

ニューロンが発奮するかを決める為の関数
どんな入力を受けても0,1をアウトプットする

データマイニング

まとまったデータから解析技術を使って隠された性質を明らかにすること

強調フィルタリング

データマイニングの技術の一つ
リコメンドシステムで利用されている
ユーザーデータ群の中から良く似たデータを見つけ出して、予測して推薦をする方法
良く似たデータは相関の強いデータという

知識表現

プログラムが解釈できる形で対象を表現したもの
知識表現の上で思考アルゴリズムが動作する

スパースモデリング・スパースコーディング

スパース=sparse=まばらな
ここでの「まばら」とは、対象に大量の要素があっても、実は少数の支配的な要素で成り立っていること。
情報をできるだけ少数の要素から表現することをスパースコーディングという

マルコフモデル

ある状態が次の状態になる確率についての考え方
次の事象が発生する確率は、現在の事象にだけ依存するという考え方
※過去の傾向・実績には依存しない。

ベイズの定理

事後確率に関する定理
事後確率とは、AとB2つの事象がある時、Bが発生した時にAが発生する確率(B→A)
条件付き確率の一種
B→A、A→B これら2つの確率の関係を結ぶのがベイズの定理

例)上記2つの確率の比率は、事象Aが発生する確率と事象Bが発生する確率の比と同じ(???)
B→A確率 : B→A確率 = A発生確率 : B発生確率(???)

ベイジアンネットワークは複数の事象間の関係をより一般的に示したもの

人狼知能

人狼というゲームで使う人工知能
人狼は人間と狼チームに分かれて、人間に扮した狼を見つけるゲーム。
会話から狼を充てる必要がある。
会話の意味を解釈して、目的を達成する必要があり。

フレーム問題

AIが想定された問題以外に対して、まったく無力になる点

モンテルカルロ木探索

複数の選択肢がある場合、最初に同じ回数づつシュミレーションする
結果から、効用を判定し、次は効用が高かったものに対して、多くの回数のシュミレーションをする
このアルゴリズムをUCB(Upper Confidence Bound)という

→完全にランダムなシュミレーションを繰り返す方法では、パターンが多いケースの場合に回答を得るのに多大な時間がかかる。
 効率のよいシュミレーション方法としてAlphaGoで採用された
 

マルチエージェント指向

特定の役割を持ったAIをエージェントと呼ぶ
エージェント同士を協調させて機能を実現する手法をマルチエージェント指向