良い実証分析・データ分析とは?
近年、産官学を問わずビッグデータを使った様々な分析が行われるようになって来ましたが、残念ながら、正しいデータ分析が行われているケースはとても少ないように思われます。工学的なデータとは異なり、人間の行動が関わる経済社会データは、統計学の基本的仮定(E[e|X] = 0)が成立しないため、統計モデルをそのまま適応してしまうと様々な統計的バイアスが生じてしまいます(複雑なモデルを使用すればするほど、そのバイアスは大きくなる可能性があります)。AmazonやGoogleなどの先端的なデータ・サイエンス企業は、コンピュータ・サイエンスや統計学の専門家だけでなく、経済社会データの統計的バイアスに精通した経済学分野のPh.D.取得者と多数雇うことで、ビックデータの中に存在する「正しい因果関係を」「正しい方法で」見つけることに力を入れています。経済社会データに存在する統計的バイアスの適切に取り除き、ビジネス戦略や政策・制度の立案に資するようなデータ分析を行うには、単に統計分析手法に精通するだけで無く、以下のような文理融合的な能力・スキルが必要となるからです。
- 統計学・計量経済学(とりわけ因果推論)に関する十分な理解
- (実際にデータ分析を行うための)プログラミング・スキル
- データに対する感性(データの中から重要な変分とそうでない変分を見つける感覚;データの変分からその背後に起こっている事を想像する能力)
- 経済的メカニズムに対する感性(データを見る前から、現実の制度・社会の中で経済主体がどのような行動をしていそうか、現実的な仮説を想定しモデル化する能力)
- (データの構造・変分に対して最も適切な統計・計量経済分析手法を選択し、異なる仮説を適切に反証・検証していく為の)論理的思考力
近年、データ・サイエンティストへの期待が高まっており、産官学を上げて人材育成の機運が高まっていますが、残念ながら、今の所、上記の [1], [2](統計手法とそれを行う為のプログラミング・スキル)にのみ焦点が置かれているように思われます。もちろん、データ分析には [1], [2] の能力・スキルは必要不可欠ですが、これらに習熟している人が [2]~[5] の能力・スキルを必ずしも持っていない場合も多く、そういった人にデータ分析を任せてしまうと、推論に大きな間違いが生じてしまう可能性が高くなり、そのような誤った推論に基づいてビジネス戦略や制度・政策設計を行ってしまうと、日本の社会・経済にとって悲劇的な結果となる可能性すらあるでしょう。
データ分析のニーズの中には、相関関係や統計的予測だけ得られれば十分なものもあります。例えば、「どういう人がどういうモノを購入する傾向にあるか?」「日銀の短観発表と株価の関係」などです。そのような分析の場合は、[1], [2]のスキルがあれば、機械学習の初歩的手法(例:LASSO)を使って比較的簡単に分析を行う事が出来るでしょう。しかし、因果関係や経済的メカニズムを分かることが不可欠であるようなデータ分析も多くあります。例えば、「どのような売り方をすると、収益が増加するのか?」「どのような制度、システムだと残業時間を減らし、生産性を高めることが出来るのか?」「ライド・シェアの導入によって、タクシー業界の収益は増加するのか、減少するのか?(どのように導入すると増加するのか?)」と言った問題です。後者のようなデータ分析は、因果関係に関する感性、創造的なデータへのアプローチ(データ加工・切り口の設定等)、データや推定結果の抽象的解釈など、文理双方の能力・スキルを総動員する必要が有り、AI技術によって分析を行うことは少なくとも現時点では難しいでしょう。
良いデータ分析者とは、例えて言うなら、良い料理人のようなものかも知れません。どのような素材も、良い料理人に掛かればそれなりに美味しい料理が出来ますが、仮に良い素材が有っても、悪い料理人に掛かれば、まずい料理になってしまうでしょう。また、素材が良ければ、高度な技法を使うよりもシンプルな技法の方がより素材の良さを生かした料理になるでしょうし、素材が悪かったり癖があったりすれば、より高度な技法で料理する必要が有るでしょう。データ分析は、これにとても良く似ています。データ(素材)の質が良ければ(例:データの変分が外生的であれば)、シンプルな回帰分析で質の高い分析が出来ますし、むしろ高度な分析手法が害となる場合もあります。
また、高度な良いデータ分析者を育てるのが難しいことは、良い料理人を育てるのが難しいことと似ています。「データに対する感性」「経済メカニズムに対する感性」「どの分析手法がより正しいかを判断する力」といった創造的にデータを活用し分析する能力は、画一的な受験・教育システムで育てていくことは難しいでしょう。もちろん、良い大学に行けば、統計学・計量経済学や統計プログラムを学ぶ事が出来ますし、受験戦争を勝ち抜く能力を持っている人は、これらに習熟する可能性も高いと思われます。問題は、その人に [2]~[5] のようなデータ分析に必要な才能・感性があるかどうか、それを育てていけるかどうかですが、残念ながら、良い大学で優秀な成績を収めていれば才能・感性があるという訳では無く、実際にデータ分析の経験を積んでいかなければ分かりません。しかし、良いデータ分析の専門家の下で、多くの質の良いデータ分析を経験していくことで、その能力を伸ばしていくことは可能かも知れません。