つながるコンテンツ
研究の壁を越えたとき V

モデル×データの現在

統計数理研究所
樋口知之教授

科学は物理学を頂点とした「モデル」構築によって、人類に多くの知をもたらしてきた。一方、近年は多面的かつ大量に獲得できるようになったデータを活用して、「モデル」では解けなかった現実のさまざまな問題を解きうるサイエンスが発展してきている。今月開催されるシンポジウム「情報とシステム2010─大量データ社会のリテラシー:モデリング技術─」を控え、2つの手法を統合する数理的なプロセス開発に取り組む統計数理研究所 樋口知之教授に、お話をうかがった。

科学者は「真のモデル」を追求していない!?

学生時代、私はどうも疑問に感じていたことがあるんです。それは、科学というのは問いを立てて基本原理から導いた「仮説モデル」をつくり、データに対峙してそれを立証するものだと教えられるし、論文もそのような流れで書いてあるのだけれども、実際に先生方の仕事ぶりを見ていると、対峙するというよりはむしろいろんなデータを見て、それを説明できるような“理論”を考えている─研究者は本当に日々「真のモデル」を追求しているのだろうかと(笑)。でも、よりよいデータが見つかったら、やはり採り入れて、もう一度考え直したほうがいいですよね。すると実際の研究というのは、今ある科学者共通の考え方に対して、ベターなものを求める作業なのではないか、と。つまりサイエンスそのものが、改良する手続きの繰り返しなのだと思うんです。

今、何らかのシンプルなルールで入力と出力の関係が記述でき、それで問題が解決できる分野はごく限られています。たとえば人の行動をモデル化しようという場合、AさんとBさんはそもそも違うわけですから、それを最初に与えた同じ式で、ぴたりと計算できるはずがありません。そこで科学の王道である演繹的な「モデル」に、データを適切に合わせ、さらに新しいデータを採り入れて日々改良していけるような手法を考えてはどうか─それが、私が研究している「データ同化」という分野なんです。演繹的な「モデル」にデータを合わせるこの方法は、今さまざまな分野に広がり始めており、今回のシンポジウムではこれも「モデリング技術」の1つと位置づけ、その知識をみんなで共有していきたいと考えています。

予測とデータを循環して改良しつづけるしくみ

たとえば台風や竜巻の進路予想などを行う地球環境モデリングという分野では、従来の演繹的なシミュレーション・モデルから、これにデータを統合するようなシステムへと、すでに世界中が舵を切っています。天気予報というと、世界最大規模のスーパーコンピュータを回してシミュレーション計算をしていると思いがちですが、シミュレーションの大規模なモデルチェンジそのものは、実は10年に1回ぐらいしか行いません。一方データのほうは、「アメダス」や気象衛星からどんどん集まってきますから、これを有効に計算に活用する「合わせ」の手法で、日々精度を上げていくことができるのです。

「合わせ」のプロセスとしては、まずたくさんのシナリオを考えます。そこへ実際のデータを入れてみて、それぞれのシナリオがどれだけデータに合っているかを「尤度(ゆうど)」という度合いで、評価していきます。そして次のステップでは、評価済みのものを新たな初期状態として使い、この一連のプロセスを繰り返すのです。そしてこの際、われわれはベイジアンモデリングを利用しています。ベイズの特徴は、なんといっても主観を入れてもよい点でしょう。たとえばシナリオの中に「経験的にはこうだろう」といった過去の知見や見込みを、反映させてもいいのです。またコンピュータの計算能力とメモリーの発達により、時間的にも空間的にも細密なデータを使って対象をより高解像度で記述し、同時にその膨大な量の局所的なモデルが計算できるようになってきています。このやり方だと、1つ1つの計算手続きは比較的シンプルになることがわかっています。これまでの全体の構造が複雑なシミュレーション・モデルの計算とは対照的ですね。

さまざまな職業が「計算サービス」へシフトする

このような小さなモデルの積み重ねによって、個人に合った医療サービスや、「マクロ」に対するマイクロマーケティングなどのさまざまな分野で、「あなたに合ったサービス」を創り出すことができます。これを「パーソナリゼイション技術」といい、みなさんもウェブサイトでよくこれを応用した「あなたにオススメ」に遭遇するのではないでしょうか。実社会でも、店頭にモニターを設置して映った人の年齢・性別・嗜好性などを計算し、その人に合った広告を掲示する「デジタルサイネージ(電子看板)」が、すでにコンビニで始まっています。

日本が誇るものづくりにおいても、生産ラインにおける製品ひとつひとつのパーソナリゼイションという視点から、いろんな知識を使って補正するシステムを作っていけば、これまでの勘と経験に代わって、マエストロの技を次世代へ継承していくことができます。このような「計算サービス」は、町工場からファミレスまで、サービスを提供する側に必ずや利益を生むはずです。将来、世の中全体がこの方向へシフトしていくことは、きっと間違いないでしょう。ところが今、日本ではあらゆる分野でそのような人材が決定的に不足しているのです。だからこそそのやり方をみんなで共有し、教育の現場にもフィードバックして、人材育成を図る必要があると考えています。

■シンポジウム「情報とシステム2010─大量データ社会のリテラシー:モデリング技術─」開催案内
日時:2010年10月25日(月)13:00〜18:30
会場:一橋記念講堂(千代田区一ツ橋2-1-2)
ホームページ: http://www.rois.ac.jp/sympo/2010/index.html

文:樋口知之・池谷瑠絵 写真:水谷充 取材日:2010/09/03