矢野和男さんの『データの見えざる手』(第5章)

今日も、ただ、ひたすら暑い。体温より暑い外気温、どう理解したらいいのだろうか。
これは外に出るなということだろうか。

本日も、矢野和男さんの著書、データの見えざる手を読み進めております。

人間の活動に温度差があるとはいえ、一日でできる小さな活動から大きな活動まである範囲に収まるという発見は、
驚かされた。U統計、U分布に、人の活動は規定されているのだ。自分の分布を知り、それをよりよくすることは、
是非ともやってみたいことであろう。加速度センサーからの人の行動、組織内部の行動構造について説明がなされたが、
第5章では、『データから見える社会を科学する』という視点からのお話をご説明いただいている。

いきなり社会構造といっても分からなくなってしまうので、まずは一人ひとりの人間の周りにある「場」とその周辺にある
人との相互作用の結果が、行動として表れるとしている。環境とのやりとり、相互作用から、行動が生まれるのだから、
環境内部に、様々な確度からの測定することができるならば、社会のある構造について語れるはずであるというアプローチを
取っておられる。人を加速度センサーという視点で詳しく見てきた方なので、場と相互作用も何かしらの方法で見える化できれば
と考えるのは、得心いたします。

様々なセンサーを取り付けた店舗内情報と、人の活動情報を照らして、売り上げを最大にするための要因を明らかにした
説明がなされています。跳躍学習を取り入れたAIシステムソフトウエアの凄さを解説いただいている。
何がすごいかって、一言でいうと、仮説生成を自動で行えるシステムに仕上がっている点にある。

計算機システムは、だいたい、よくわかっている専門家が、その知識のうえに、システムをくみ上げる。
これが何がダメかといえば、その専門家の恣意が、知らず知らずに入ってしまう点にある。
問題をシンプルに置き換えて、簡単かしてしまうような発想では、社会構造のような複雑な事象を扱うことができない可能性が
あり(気づかないだけで、シンプルな構造表現できる場合もあるし、それを見つけることがこれまでの科学手法でもあった)、
複雑な事象とは、どの方向からどうやって分けるのかすら、分からないほど、複雑なので、であるならば、帰納的な部分については
複雑なまま計算機に扱わせてしまおうという立場で説明される、これなんぞは、目から鱗である。

矢野さんらのAIシステムが画期的であるのは、データから仮説を自動生成、その仮説数も数百万の仮説を作りだして、
ある特定のパフォーマンスを高める因子を見つけ出せるようである。モデルはこうだと思い込んで、プログラム開発をするのではなくて、
データからすると、どうもモデルはこうなっているようだと、モデルの逆生成を行っているという、なんともすごいことである。

システム屋からすると、いままでの反対の行動でどんどん進んでおられるので、たいへん興味がわく次第である。
これができるなら、これからの必要となるといわれるデータアナリストも、いらなくなるのではないか。
アナリストがデータ分析を繰り返して、1つの道筋を見つけている間に、跳躍学習Hは、膨大な仮説から、
非常に多くな有用なストーリを示して頂ける可能性がある。もちろん、業界の専門家ですら、気付けない点についても、
きっとHシステムから、ご提案をいただけるのであろう。ほんとに、カッコいい。

今後私たちがなすべきことが分かった気になった(気づかせて頂けたというべきか)。
前提として、何を目標・目的に据えるかである。この目標・目的は、人間でしかできないことであり、意思を表すということだ。
そしてのその目標・目的を表現するために、どういうミクロなデータを集めるかを決めなければならない。
いついかなる時も、均質なデータを延々と取り続けること。取ったり取れなかったりするデータでもなくて、
24時間365日のデータ(時間軸上はできる限り短い時間、データ量はその分増えるが)を手にすることである。
この膨大なデータ量を手にした後、そのデータから目的や目標に到達するストーリを、計算機に導かせる。
人が作りだす仮説なんてものは、個人の恣意が入り、仮説のうちに入らないという世界が、近づいてきているようにも思えた。

目標設定⇒均質なデータ取得⇒データから多くの仮説を作り、目標を達成するモデルを逆生成する。

将棋・囲碁、画像認識、自動運転、こうした考えがベースになって、それぞれのアプローチを進めているように思います。
わたしも、こうした動きに少しずつでも理解を深め、前に進めるアプローチできたらと思います。

矢野さん本、いよいよ残りは6章だけになりました。矢野さんの見ている世界観を少しでも近づくことができたらと思っています。
勉強になります。