機械学習と深層学習の違い

今年も桜が綺麗な時期になりました。満開のサクラ並木の下を、散歩をしてきました。
気分が良いので、このままブログでもと、書いてみました。

AI百花繚乱ですね。

最新論文をキャッチアップし、さらにその先のモデルを提案・実証を続けることは、労を要する。
https://zuuonline.com/archives/180974
素晴らしい結果も、再現性が確認できないと、価値はない。
再現性のため、論文のみならず、データ+プログラム+結果の3点セットを提示させる学会もあると聞く。

機械学習と深層学習、強化学習との違い、ベイジアン統計学と機械学習の関係性をきちんと理解したうえで、
AI的な手法をどう取り入れるかを考えたい。

すべてがAIという用語に括られてしまい、今がどんな状況にあり、どういう方向に進んでいくのか見通した説明がないのは問題では。
産業への応用が大事という視点からすると、AIの技術的な総括がないなか、どの方向が正解なのかと悩んでしまう。
多くの技術者、その上の経営する側も、わからなくなっているのではないでしょうか。

機械学習の目標は、与えられたデータ(教師信号)を出力する関数を求めることだ。与えられる複数のデータを少しずつ変えることで、
正解データに近づけられる関数を求めることと理解している。代表的な手法は、勾配降下法。どこに正解として落ち着くのかが、
わからないので、入力を少しずつ変えて、落ち着きどころを探るそのプロセスを機械学習と呼ぶのだと理解する。
深層学習は、全体のアーキテクチャ(構成するパラメータも含む)を、正解からのずれを修正するプロセス(逆伝搬法)を取る。

それぞれの立ち位置は、データに対する態度が、客観か、主観かの違いともいえる。
どちらも、データのなかでどこに区切りがあるのかを見い出しにくい課題を扱うが、入力と出力の関数を導出を、複数の入力データ
を少しずつ変えて、正しい結果を得ようとする客観的な学習と、結果からのずれがなくなるようにアーキテクチャ自身を自ら変更
していく主観的な学習との違いともいえる。充実したpythonライブラリのおかげで、データセットに対する機会学習の結果は得やすい
状況にある。深層学習は、画像・音・テキストを扱うが、まだ何をどのように扱えるのか発展途上である。機械学習の範囲を超えた
複雑な課題に対して、深層学習のアプローチが進んでいる。

まずは課題ありき。その課題が有する特徴を理解したうえで、どのAI的な手法を使うべきかの決めなければならないが、どういった
問題にどんな手法が効果的であるかを、エンジニアは理解をするべきと考える。

さらにその手法を使ったときの事業性(それでうちはどう儲かるの?)に応えられるべきと考えます。
GEのような大量センサーによる保守サービスモデルへの転換とばかり、その方向に追従してしまっているようにも思います。

いま必要なことは、様々な技法のまとめと総括をして、技術の方向性を示すこと、そしてそれでどう儲けるかを示すことと思います。
もちろん、言うは易しですが。