機械学習と深層学習の違い

今年も桜が綺麗な時期になりました。満開のサクラ並木の下を、散歩をしてきました。
気分が良いので、このままブログでもと、書いてみました。

AI百花繚乱ですね。

最新論文をキャッチアップし、さらにその先のモデルを提案・実証を続けることは、労を要する。
https://zuuonline.com/archives/180974
素晴らしい結果も、再現性が確認できないと、価値はない。
再現性のため、論文のみならず、データ+プログラム+結果の3点セットを提示させる学会もあると聞く。

機械学習と深層学習、強化学習との違い、ベイジアン統計学と機械学習の関係性をきちんと理解したうえで、
AI的な手法をどう取り入れるかを考えたい。

すべてがAIという用語に括られてしまい、今がどんな状況にあり、どういう方向に進んでいくのか見通した説明がないのは問題では。
産業への応用が大事という視点からすると、AIの技術的な総括がないなか、どの方向が正解なのかと悩んでしまう。
多くの技術者、その上の経営する側も、わからなくなっているのではないでしょうか。

機械学習の目標は、与えられたデータ(教師信号)を出力する関数を求めることだ。与えられる複数のデータを少しずつ変えることで、
正解データに近づけられる関数を求めることと理解している。代表的な手法は、勾配降下法。どこに正解として落ち着くのかが、
わからないので、入力を少しずつ変えて、落ち着きどころを探るそのプロセスを機械学習と呼ぶのだと理解する。
深層学習は、全体のアーキテクチャ(構成するパラメータも含む)を、正解からのずれを修正するプロセス(逆伝搬法)を取る。

それぞれの立ち位置は、データに対する態度が、客観か、主観かの違いともいえる。
どちらも、データのなかでどこに区切りがあるのかを見い出しにくい課題を扱うが、入力と出力の関数を導出を、複数の入力データ
を少しずつ変えて、正しい結果を得ようとする客観的な学習と、結果からのずれがなくなるようにアーキテクチャ自身を自ら変更
していく主観的な学習との違いともいえる。充実したpythonライブラリのおかげで、データセットに対する機会学習の結果は得やすい
状況にある。深層学習は、画像・音・テキストを扱うが、まだ何をどのように扱えるのか発展途上である。機械学習の範囲を超えた
複雑な課題に対して、深層学習のアプローチが進んでいる。

まずは課題ありき。その課題が有する特徴を理解したうえで、どのAI的な手法を使うべきかの決めなければならないが、どういった
問題にどんな手法が効果的であるかを、エンジニアは理解をするべきと考える。

さらにその手法を使ったときの事業性(それでうちはどう儲かるの?)に応えられるべきと考えます。
GEのような大量センサーによる保守サービスモデルへの転換とばかり、その方向に追従してしまっているようにも思います。

いま必要なことは、様々な技法のまとめと総括をして、技術の方向性を示すこと、そしてそれでどう儲けるかを示すことと思います。
もちろん、言うは易しですが。


機械・ロボット化の先にある世界

米自動車工場で稼働するロボットは2017年の全数12万7千台、この6年間で70%増加した。この結果、産業の付加価値額は、右にあがるが、一方で雇用者数はピークの7割にとどまっている報告がある。

MITのダロン・アセモグル教授らの研究によると、「1000人の労働者に1台のロボットが導入されると、人口比の雇用率が0.18-0.34ポイント減少する一方で、賃金は0.25~0.5ポイント押し下げられた」そうである。

安田先生は、ロボット1台が5-6人の雇用を奪うとも言い換えている。グレートデカップリングであらわされるように、ロボット・機械の導入が進むほど、労働生産性と1人当たりのGPDは上昇する一方で、雇用者数と家計の所得(中央値)は右肩に下がる傾向を持つ。

下記図、2000年頃から、顕著な傾向をみることができる。雇用はすでに機械に奪われつつあるのだ。

https://pbs.twimg.com/media/Cd-Vqp2UUAA6fK0.jpg

そして、最近、鈴木貴博さんの仕事消滅を読み、さらに驚いてしまった。わたしは前のブログで、少子高齢化が進む日本で労働人口相当をロボット・機械に置き換えたら良いと思うと述べたが、鈴木さんは、さらに先をお考えで、(話は単純ではないが、要約すると)「機械・ロボットに税金を課す」ことのようである。あまりに思考が先に進みすぎているようにも思えるが、上で述べた傾向がさらに進むその先のうち手の1つとして、「ロボット税」が現実味を帯びてくる気もする。ピケティが指摘した資産家に偏るのを抑えるには、累進課税しかないという問題と同義かもしれない。

ちょっと時間がないので、今日はこのあたりで失礼します。


「NHK 3月22日放送記念日特集・今テレビはどう見られているか」への所感

ほぼ国民にスマホが行きわたっている現在、スマホとテレビの関係がどうなっているかは、ずっと興味を持っていた。スマホでいつでもどこでも視聴はできる。日本は録画装置の普及もあり、その視聴形態が大きく変化しているだろうとは、薄々みんな気づいていた。そこに、NHKがなんとも刺激的な放送内容を突っ込んできた。

映像はyoutubeにあるにはある。

若者のテレビとの接触についてであるが、テレビを見ながら、携帯電話やスマホを操作している現状の説明がしばらく続く、テレビ・スマホ・タブレットの3つを同時に操作しながらテレビを見ている若い女性が紹介される。トリプルスクリーン視聴と呼ぶのだそうだ。確かにテレビを見ながら、検索をしている人は多いだろうなと思う。

若者らの意見では、要点をおさえらた動画で見るということだった。動画は番組という意識ではなくて、動画として見ているという意見があった。テレビのリアルタイム視聴時間は、若者については大幅に下がっている。10代では140分⇒80分へ、20-34歳でも60分程度減少している。その代わりに、サイトに上がっている動画を見ているということの説明があった。その60分はサイトの動画を見る時間にシフトしているようだ。

視聴者がメインであり、スクリーンはすべてサブとなってしまった。君の名の映像が細切れで高速に進むことを思い出す。若者の観かたを意識した作りになっているといわれるが、ものの数秒で次から次へとシーンが切り替わる。複数スクリーンを同時進行で観るという視聴法にもつながっていると思える。

次に逃げるは恥だが役に立つ(逃げ恥)大ヒットの説明にうつる。初回10.2%からはじまり、最終話(11回)まで20.8%まで視聴率は伸長した。録画再生視聴率を含めると、20%⇒33.1%に至り、社会現象にまで至った。視聴率がどうしてこのような伸びを示すことができたのかに話が及ぶ。回を追うごとに、逃げ恥にどう人が流れ込んできたか。ネット上にあふれかえる記事、SNSで人々は接触が始まり、恋ダンスというキーワードに接触することで、検索をし、ネットの動画に触れる。見逃した番組をすべてネットで観た後に、最終話だけはライブで視聴をする。

この記事をあげたり、SNSで情報発信をする、コンテンツハンター、ヒットライダーが1600万人いると解析している。これらの多くの一般の人の発信を多く巻き込みながら、その番組への誘導を達成しているといえる。

ノルウェーのSKAM(恥)の紹介におよぶ。(記事1記事2)この番組は、ネットで見てもらうことを前提に番組を作っているとのこと。通常のテレビ番組のシーンをバラバラにして、毎日小出しでネット上に投稿する手法に切り替えたという。動画クリップ⇒SNS写真⇒SNSメッセージ⇒動画クリップ⇒SNSメッセージ⇒動画クリップのように。週に1度動画クリップをまとめた動画が放送されるという。SNSを多用することで、若者とつながることができ、若者を引き込むことに成功したようだ。

この手法は、まだ日本では応用されていない。さらに刺激的な言葉が流れている。流入経路がそれだけ多様化できるのであれば、その流入経路単位に広告を再配置したりする設計もありえそうである。生活者が主体というメディア環境への変化に合わせて、テレビの観かたが大きく変わるなかで、ネットとの向き合い方も大きく変化していくなと感じた。NHKがこのような情報をあえて発信したことは意義深いと思った次第である。

 

 


経産省資料「新産業構造ビジョン」(案)~第4次産業革命をリードする日本の戦略~

第2回シンギュラリティサロンのウェブサイトから、経産省の2030年代に目指す新産業論に関する資料を読んでいる。産業構造が大きく転換し、稼ぎ頭の企業があっという間に後ずさりしてしまう中、優位なポジションを創り出すために、何をなすべきか、経産省のお考えに触れることができた。

「新産業構造ビジョン」(案)~第4次産業革命をリードする日本の戦略~ 平成29年1月現在

資料は188ページにも及ぶ。かなりのボリュームである。これから20~30年の間に、日本はどのように売上、利益を出すと、国家としてお考えなのか理解したいと思っている。海外のプラットフォームビジネス企業の下請け化することだけは避けねばならない。機械とソフトウエアが国内の単純労働を代価していくことは避けるべきだろうか、人口減少時代に人に変わってさらに効率的に行われる部分は、機械化しかないだろう。以前ブログに表したように減少する人口1000万人を、100万台(仮)のロボットでまかなえる方法が見つかればよいことになる。

とりわけ175ページから始まる、就業構造転換のポイントの資料あたりから意見をくみ取れる。定額・定型の保険商品の販売員、スーパーのレジ係、大衆飲食店の店員、中低級ホテルの客室係、コールセンター、銀行窓口、倉庫作業員、経理・人事部門、データ入力係は、機械システムによって変わっていくことが想定されている。さらに、IoTサービスで見守るというよりも、家庭に、掃除・洗濯・料理を代行する家政婦ロボットをお買い求めいただき、サービスを提供するとしたら、倫理文化問題はあるにせよ、活用されるのではないか。人が日々行っている作業を変わって、黙々と対応してくれるロボットが現れないだろうか。

個人の多様な行動から様々なデータを集める動きがあり、データの囲い込みが一層進む段階にあるが、アマゾンのアレクサを見ても、いまだ米国主導である。そのデータをいかに利活用するかの制度・ルールも未熟であるため、これから個人データの扱い、扱われ方には注意を要する。個人情報保護法の改正

 


台風一過の晴天、お盆も終わり

台風7号、大したこともなくて、良かったです。明け方ざわついてましたが、しっかりと睡眠も取れて、朝から一転快晴です。今日も暑くなりそうです。

7/29日に、日銀が年3.3兆円から増額して6兆円を買いいれると宣言して約2週間が経過した。日経225銘柄が買い入れられ、TOPIX銘柄(東証1部全体)は225ほど買い進められないという予想から、225を買って、TOPIXを売るという方針もそうだなと思う。225の時価総額290兆円/225銘柄に対して、TOPIX494兆円/1973銘柄で、225だけで約6割占めてます。

NT倍率(225÷TOPIX 現在12.8)は、しばらく上昇しそう。いずれ政治的発表とともに、急落する場面が来たら、反対に日経平均を売ることで対応するのだろう。

以上、ぼーとした頭で浮かんだ短文ブログでした。