青嶋 誠・矢田 和善 (情報)

 

~ 21世紀の科学をリードする数学、統計学

 

 (1) 統計学とは、どんな学問でしょうか?

統計学とは、21世紀に生きる我々にとって必須のスキルです。いわば、リテラシー(読み書き能力)と呼べるものです。膨大なデータが氾濫した不確実な現代を生きる我々にとっては、データを精査し読み解いて精度の高い判断を下すために、統計リテラシーを身に付けておく必要があります。

どんな分野も、経験を蓄積し、データを集め、それらを分析して戦略を練ることで、最善の答えを探します。この一連のプロセスが統計学です。データがあるところに統計学ありです。自然科学、医学、教育学、心理学、社会学、経済学、経営学、文献学、さらにはスポーツの戦術分析など、ありとあらゆる分野に統計学が使われています。

 “I keep saying that the sexy job in the next 10 years will be statisticians.”
(これからの10年で最もセクシーな職業は統計家だろうって、言い続けているんだ。)
これは、Googleのチーフ・エコノミストであるハル・ヴァリアン博士が、2009年の基調講演で語った余りにも有名な言葉です。統計家がセクシー(魅力的)だと言われる時代が、ついに来たのです。


青嶋 誠 教授

矢田 和善 助教


 (2) 研究内容を簡単に教えていただけますか?

我々の研究テーマの一つは、高次元データ解析の理論と方法論の構築です。現代科学に見られるデータの一つの特徴は、データの次元数(p)が標本数(n)に比べて遥かに大きな、高次元小標本(p>>n)にあります。例えば、ゲノムデータは、数万から数百万の次元数(遺伝子数)をもちながら、数十程度の標本数(被験者数)しかありません。


DNAマイクロアレイデータ


従来の統計学は、このような膨大な次元数を想定しておらず、次元数よりも標本数が十分に大きいことを前提としています。そのため、従来の統計学は、高次元小標本のデータ解析に統計的な精度を何ら保証してくれません。それどころか、従来の統計学は高次元小標本のデータ解析に誤った解を与える場合もあることが数学的に証明されています。高次元小標本のデータ解析には、従来の統計学の枠組みを超えた新しいアイディアとアプローチが必要になるのです。

我々の一連の研究で見出したアイディアは、高次元小標本におけるデータ空間の幾何学的表現と、その特性を生かすデータの双対空間における統計的推測法の開発です。そして、開発した方法論に統計的な精度保証を与えることを可能にする統一的アプローチが、高次元小標本(p>>n)漸近理論の構築です。

高次元データ解析における精度を保証する推測は、Aoshima and Yata (2011)で初めて与えられました。この研究成果は、先駆的かつ多くの有益な結果を有するものと評価され、2012年に国際賞Abraham Wald Prize in Sequential Analysisを受賞しました。さらに、我々の一連の研究は国内からも高く評価され、「従来の多変量解析の枠組にない極めて独創的かつ先駆的な研究を展開している。両氏は、理論から数多くの優れた研究業績を挙げ、革新的かつ有意義な方法論を生み出し、理論と応用の両面から統計学界に多大な貢献をしている」と認められ、2012年度日本統計学会研究業績賞を受賞しました。これらの詳細については、日本統計学会会報No.152 (pp.7-8)及びNo.153 (pp.12-14)に掲載されています。



 (3) これから統計学を学ぼうとする人たちへメッセージをお願いできますか?

コンピュータの普及に伴い、最近では、個人で手軽に統計ソフトを使える良い時代になりました。データを入力しさえすれば、何かしらの解析結果が得られます。しかし、使用する解析法の数学的仮定や、解析結果がどの程度の精度を保証するものかといった理論的背景については、しばしば、ないがしろにされているように見受けられます。これは無視できない問題で、解析法の誤った使い方や誤った解釈に気付かずに、誤った判断をすることで、致命的な結果をもたらすことにもなりかねません。

近年の急激な情報化の進展に伴い、新たな問題も出てきました。ツィッターなどのSNSでは、つぶやき等、個人行動に関する膨大で多様なデータが日々蓄積されています。ビッグデータ時代の到来は、既存の統計学では想定しなかった新しいタイプのデータと、それに付随する新しい問題を生み出しています。

これからの時代は、膨大で多様なデータを適切に扱うための、柔軟な思考力が問われます。数理的なアプローチができるような、統計学を専門とするエキスパートの需要は、ますます増加しています。既存の統計学の枠組みにはない事例に対しても、数理的に正しくアプローチできるような人材を、社会は求めているのです。新しい問題を解決するための新分野の開拓にも、積極的に取り組めるような人材が望まれます。もはや、既存の手法(ソフト)を用いた統計解析ができるだけでは十分とは言えません。抽象度のレベルを上げて、統計学の背後にある数学的背景を正確に理解することが、何より重要になります。これは、まさしく、我々の研究スタンスそのものでもあります。

統計学を数理的にきちんと学ぶことができる教育体制と研究環境は、今後、ますます大事になるでしょう。我々は、今後も、時代のニーズに合った新しい統計学の理論と方法論を開拓し、いち早く世に広め、また、これからの時代に生きるタフな人材を育成することで、社会に貢献していきたいと思っています。