AI技術の実用化・発展に貢献し続ける機械学習の役割と仕組み
機械学習は、現在の人工知能(AI)のコア技術であり、インターネットに匹敵するインパクトを持つ技術です。
特に機械学習の発展版であるディープラーニング(深層学習)は、人間を凌駕する認識や分析、予測の能力を持つまでに進化しました。
機械学習とはどのような技術で、生活や仕事、ひいては社会をどのように変える可能性を持つのか。
こうした知見は、あらゆる業種のエンジニアが持つべき基礎知識となっています。
機械学習には、特徴的なアルゴリズムや教師データの有無など、多様な種類があります。
ここでは、機械学習の役割と仕組み、アルゴリズムの違いによる応用適性などについて解説します。
Contents [hide]
機械学習を取り入れたことがAIの実用化につながった
AIについての話題をよく耳にするようになりました。
1990年代後半から2000年代初めにかけて、インターネットがあらゆる物事を変えたように、これから十数年間は、金融やものづくり、医療、建設、農業といった多様な分野の仕事、さらには日常生活をAIが一変させることでしょう。
もはや一過性のブームといえる状況ではないAI。
実は、以前にも2回のAIブームがあったのですが、実用として結実することなく技術的な難しさを背景に衰退していきました。
しかし、今回のブームは本物です。
画像認識や傾向抽出など、特定の作業では、人間の能力を超える力を発揮するようになっています。
では、以前のAIと現在のAIでは、一体何が違うのでしょうか。
最大の違いは、コア技術に「機械学習」を採用した点です。
機械学習とは一体なんなのか?
機械学習とは、膨大な量のデータ(ビッグデータ)の中に潜む傾向をAI(機械)が自ら学習し、類似パターンを見つけ出す技術のことを指します。
学習の手本になるデータ(教師データ)が多ければ多いほど、高精度でパターン抽出(推論)をできるようになります。
機械学習で、どのように推論能力を学習するのか、犬と猫の写真を見分ける例で説明していきましょう。
犬と猫を見分ける際、かつてのAIでは、動物の写真を耳や鼻、眼、骨格などのパーツごとに分解し、チェック項目としてそれぞれの形や質感を見分ける際の基準と手順を定式化し、AIに学習させていました。
ところが、同じ犬でも写る角度や撮影時の光の具合によって、見え方が大きく変わります。
また、猫に似た耳の形の犬もいます。
このため、正確な判断が思いのほか困難でした。
一方、機械学習では、犬や猫の見分け方をあらかじめ定めて教えることはしません。
大量の写真を集め、犬の写真と猫の写真を人間が分類します。
AIに写真を1枚ずつ見せながら、人間が「これは犬」「これは猫」と答えを教え込みます。
すると、何万枚、何十万枚もの写真を教師データとして学んだAIは、徐々に正確な判断を下すようになり、最終的には人間を超える精度で見分けるようになるのです。
機械学習の核となるニューラルネットワークと教師データ
犬と猫を見分ける方法は一切教えないのに、AI自らが見分け方を悟り始めるという点が機械学習のポイントです。
では、機械学習を行うコンピュータの中では、学習や推論の際にどのような処理をしているのでしょうか。
機械学習ベースのAIでは、コンピュータの中に、脳の構造をプログラムで再現した「ニューラルネットワーク」と呼ばれる神経回路網モデルが組み込まれています。
ニューラルネットワークは、データを受け取る入力層、学習内容に応じてネットワークの状態を変える中間層、データを吐き出す出力層で構成されています。
脳の神経細胞を模した各ニューロンでは、前層のすべての出力を受け取り、ひとつひとつに“重み値(ウエイト)”を乗じて合算し、合計値に応じてそのニューロンの有効・無効を切り替えて、ネットワークの形を変えていきます。
機械学習では、学習を繰り返すことで、各ニューロンの重み値が次第に最適化されていきます。
一般に、中間層が多くなればなるほど、内部で実行する判断処理が複雑になるため、より正確な判断を下せる傾向があります。
中間層の部分を20層~30層と深くして高精度化したものをディープラーニングと呼びます。
機械学習ベースのAIを賢く育てるには、質の高い教師データが大量に必要になります。
質の高いデータとは、学習時のAIが誤解することのない、生のデータに含まれるノイズや不適切な部分を取り除き、学習効果の高い部分を集めたデータのことを指します。
学習前にデータの変換や加工をしておき、質を高める前処理のことをデータクレンジングと呼びます。
先の犬と猫を見分ける例では、写真を見せながら答えを人間が教えていました。
こうした答えを教える人がいる学習法を「教師あり学習」と呼びます。
機械学習の多くは教師あり学習なのですが、AIが膨大なデータの中から自律的に傾向を導き出す「教師なし学習」と呼ばれる手法もあります。
2012年、Googleが教師なし学習で、ネット上の画像から学んだAIが猫の認識に成功した成果を発表し、世界中を驚かせました。
機械学習の活用にはその特徴の見定めが重要
機械学習で実現する高度な推論能力は、既にネット検索での行動に応じた広告表示やスパムメールの分別、画像認識、自動翻訳など、多方面で活用されています。
今後は、自動運転車や知識管理、医療現場での診断支援、さらには未来予測など、より多くのシーンで活用されることになるでしょう。
機械学習ベースのAIを活用する際には、特徴を正しく知ることが極めて重要です。
犬と猫の見分ける例で示したように、機械学習では、推論時の判断条件や手順を、一切定義しません。
そのため、正しい結果が得られていても、根拠が不明です。
一方で、人間が推論の方法を指定しないことが逆に、人間には見えにくい傾向や場の空気、文脈、時代の気分などを察知できるメリットになっています。
また、推論の結果は、「これは犬である」と断定するのではなく、「犬の確率は81%」「猫の確率は19%」といった曖昧さが残る確率で出力されます。
このため、推論結果から結論を導き出すためには、確率を参照しながら人間や従来のコンピューターが「これは犬である」と決める必要があります。
さらに、学習済みの機械学習ベースのAIは、特定作業に関しては際だった能力を発揮しますが、万能ではありません。
育て方次第で、囲碁に強いAIも、自動車の運転が上手いAIも作れますが、囲碁に強いAIで自動車を運転することはできません。
人間ならば、1人で両方の作業ができる人は多くいます。
機械学習でのアルゴリズムの役割
機械学習で用いるニューラルネットワークのアルゴリズム(モデルの構造と活用法)を工夫することで、推論精度を高める取り組みが進んでいます。
既に、目的に応じた様々なアルゴリズムが提案されています。
画像認識には、CNN(畳み込みニューラルネットワーク)と呼ぶアルゴリズムがよく使われます。
画像全体を細かな領域に分解して、領域ごとに類似性を比較し、組み合わせて大きな類似性を抽出するアルゴリズムです。
一方、機械翻訳や文書認識、音声認識など自然言語処理では、RNN(リカレントニューラルネットワーク)と呼ぶ、文脈やストリー展開に応じた推論に向くアルゴリズムが使われます。
他にも、機械学習の各応用に適した多様なアルゴリズムが提案されています。
アルゴリズムの使い分けに迷う人のために、「scikit-learn cheat-sheet」と呼ばれる、目的に応じた最適なアルゴリズムの早わかりマップがネット上で公開されています。
また近年では、専門的な知識がなくても機械学習を手軽に活用できるよう、目的に応じたアルゴリズムや、ある程度まで学習を進めたライブラリなどをそろえたフレームワークが無料で数多く提供されています。
機械学習の活用に慣れる環境は、かなり整ってきています。
あなたも、1度試してみてはいかがでしょうか。