ビッグデータ・アプローチ

4月半ばに、ヤフージャパンが景気指数を独自に発表したことを記憶されている方は多いと思います。

政府が発表する景気指数は、遅れがある(実際3ヶ月に一度)という事実があり、、ビッグ・データから今の景気の状態を表すことができたら面白かろうというプロジェクトだと思います。

2012年検索された75億語から、日々検索される60万語まで絞り込み、さらに景気と高い相関関係にある、206の単語に絞ることができたとあります。私はもっと数万語、数十万語規模になるのではないかと思いましたが、200程度の単語で表されるとは、思いの外少ないという印象でした。

過去の景気動向指数から、リアルタイム景気指数を、概ね予測ができそうとの発表でした。

従来のように地区・商品別集計から、動向分析までが数ヶ月かかっていた方法とは違った視点で、日々検索される単語からマクロ経済指標を算出できる可能性を示したことは、とても興味深い。これは、ビッグ・データの可能性を示した話だと思いました。

[browser-shot width=”400″ url=”http://event.yahoo.co.jp/bigdata/keiki/”]

精度の向上した指標を提供できるならば、金融業界と組んで新しい金融商品を立ち上げることが可能になるでしょう。こうした独自の経済指標によって、これから景気が落ちこむという予測されるならば、金融先物を先んじて売りはじめることも可能と思われます。その手前でも、マクロ指標を手にしたいと思う中間の業者も存在するかもしれません。

この発表は、年75億件も検索されるヤフージャパンだからできる所業だと思いますが、これまでは無駄なデータと思って捨て去られていたアナログデータは、デジタルデータ化としてその価値を見つだす機運が高まるのだと思います。そのデータの相関から、新しい知見がどんどん発見される時代に入ったのだと思います。

総務省統計データの開示

おむつとビールのセットは、良く売れるのように、その理由はよく分からなくても、小売店の販売方法には大きな影響を与えた。大量の購買データから、見つけられた1例である。

大量データを保有する業者が、さらなる業務の効率化や売上を伸ばす目的のために、データのなかに潜んでいる、なにかを見つけ出そうとする動きがある。

ひとが想像する仮説や推論によるデータ検証というスタンスから、データから直接引き出される結果に対して、あとからその理由をつけることになる。予想もし得ないストーリを導ける可能性を期待する節がみられる。(棚から、ぼたもちがあるかもですね)

ビッグデータの期待

ビッグデータの期待

昨日6月10日に、総務省の統計データが開示された。

日本国の統計データをコンピュータ経由で閲覧・処理ができるようになった。全部で22のデータベースの市区町村別単位のデータ。グーグル・マップの上に、可視化して見せるなどは、すぐにできるのだろう。

ここから転記:http://statdb.nstac.go.jp/system-info/api/api-data/

1.. 国勢調査
2.. 住宅・土地統計調査
3.. 住民基本台帳人口移動報告
4.. 人口推計
5.. 労働力調査
6.. 就業構造基本調査
7.. 社会生活基本調査
8.. 個人企業統計調査
9.. 科学技術研究調査
10.. サービス産業動向調査
11.. サービス業基本調査
12.. 事業所・企業統計調査
13.. 経済センサスー基礎調査
14.. 家計調査
15.. 貯蓄動向調査
16.. 全国消費実態調査
17.. 家計消費状況調査
18.. 小売物価統計調査ーーー>現在、データ更新中のため利用できません。
19.. 全国物価統計調査
20.. 消費者物価指数
21.. 地域メッシュ統計
22.. 社会・人口統計体系(都道府県・市区町村のすがた)

保有するビジネスデータと、これからの統計データを掛けあわせることで、きっと興味深いデータを引き出せると期待した動きがはじまった。今後、さまざまなフィルターを通して見える世界には、予想もしてなかった驚きの内容が含まれるのか、そんなこと知ってるよということになるのか、今後の取り組みにかかっている。
このデータの活用方法について、どなたか一緒に、仕事・ブレストしてみませんか?

[browser-shot width=”300″ url=”http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121400.html”]