つながるコンテンツ
明日へとつなぐ鍵Ⅻ

「巨大グラフ」に挑戦します。

国立情報学研究所
河原林健一 教授

ますます膨張するネットワーク上で増え続ける情報は、近年「ビッグデータ」と呼ばれている。このようなデータの増加にコンピュータの性能が追いつかないなか、巨大なネットワークを解析できる高速アルゴリズム開発に大きな期待がかかっている。理論計算機科学離散数学など最先端の数学を駆使した解析手法、高速アルゴリズムの開発、人材育成など、火急の重要課題を統合させたERATO河原林「巨大グラフ」プロジェクト&ビッグデータ数理国際センターが、2012年10月にスタートした。その研究総括を務める国立情報学研究所 河原林健一教授にお話を聞いた。

「巨大グラフ」とは何か?

インターネットウェブというしくみや、Twitter・Facebookなどのソーシャル・ネットワークは、それぞれ約10の9乗(10億)人ものユーザが利用しています。これらの巨大なネットワークは急速に膨張しており、遠くない将来に10の10乗を超えるだろうと予想されています。このようなネットワークの中にいるユーザを「頂点(ノード)」、各ユーザ間に生まれた人間関係を「辺」として、ノードと辺で作られる図形を「グラフ」といいます。たとえばTwitterならば、あるツイートに対して誰かがリツイートしたら関係が出来たと考えることができますから、そこに辺を足す。facebookならば、友達関係にある頂点の間には辺が立つわけです。

このような膨大な頂点を持つグラフを、「巨大グラフ」と呼んでいます。われわれは、このつながった関係がどういう状況になっているのか、つまりどんな形をしたネットワークなのか、まずその数学的な特徴をつかみ出そうと考えています。幾何学だけでなく、どの物理現象に近いかを解析したり、トポロジー的な性質があれば使ったりと、ありとあらゆる最先端の数学的な道具立てを駆使して解析していきます。

このようにプロジェクトの入口は数学ですが、解析した結果としては、たとえば人間の購買行動や広告効果といった、社会的に役立つような出口を目指しています。というのも1つには、近年コンピューティング・ソシオロジーという分野が活発で、このような研究の方向性は世界的にトレンドでもあるんですね。また共通のフレームワークのようなものよりも、何らかの指標を持って具体的なコミュニティを得るにはどういう手法があるかというふうに開発していったほうが、欲しい情報が得られて、おもしろい結果が出てきます。数学的なエッセンスと、解きたい問題や現実の課題の性質に合った手法との両方で攻めなければいけない、というのが今日的な課題だと言えるでしょう。さらに携帯電話や個人利用のコンピュータといった計算能力やメモリが十分ではない環境でも、現実的な時間で解くことが出来る高速アルゴリズムを開発していきたい、と考えています。

刻々と変化するソーシャル・ネットワーク

このプロジェクトには、ソーシャル・ネットワーク、複雑ネットワークとしての道路ネットワーク、最適化問題、ヒューリスティックを活用した手法の検証という4つのサブグループがあり、それぞれが具体的な応用分野を担っています。このうちソーシャル・ネットワークだけでも、いろいろやりたいことがありますね。まずネットワーク内で何が起こっているのか、いちばん重要な点は「情報伝達の解析」です。そしてネットワーク内でコミュニティがどう形成されているかという「コミュニティ解析」は、たとえばある商品を買ってくれそうな人々の集まりに対して、こういう宣伝を投げようというように、商業的にも幅広い応用が見込まれ、また災害時の情報伝達などにも役立ちます。またその時に関わってくるのが、コミュニティに影響を与える人物とそうでない人物といった重要度・影響度の解析。人間関係も一様ではなく「辺」が担う「重み」は変化します。

ところでこの「巨大グラフ」は、リアルタイムで変化・膨張し続けています。ネットワークのある時点をスナップショットして、これを1つのグラフと見て解析するのは比較的簡単でも、ノードや辺がつけ足されたり、場合によっては消えたりといった動きを加味すると途端に複雑になります。われわれが対象としているのは、このような動いているグラフの解析ですね。また解析するだけではなく、今起こっていることをそのままダイレクトに反映させ、そのネットワークが近未来にどう成長していくかを予測できるようなモデルの構築を目指しています。

インターネットの中だけでなく実社会でも、交差点、駅、建物などを頂点とし、これらが、路線といった辺で結ばれたものとすると、地図交通もネットワークと考えることができます。ちなみに現在のカーナビは、10の5乗から6乗ぐらいのサイズのネットワークになっています。ところが交通網というのは、ある意味ではソーシャル・ネットワークの対極にあるネットワークなんですね。「スモールワールド」現象で知られるように、ソーシャル・ネットワークでは、6人の知人を介せばつながることができるのに対して、道路ネットワークにはそのような性質がなく、たとえばトポロジーの性質などがポイントになるためです。道路ネットワークの解析は、道案内、交通管制、地理情報のサービス、そして災害時の輸送や避難路の策定といったさまざまな応用につながります。

世界と肩を並べるリサーチャーの育成を

現在、プロジェクトを推進するための研究体制やオフィスの確保などを進めており、当初特任教員4名、ポスドク7名、リサーチアシスタント15名ほどでスタートしましたが、今後約倍の人数に拡大していく予定です。実はこのメンバーのほとんどが32歳以下の若手研究者と大学院生なんです。そもそもERATOのプロジェクトの特徴として、未来につながるイノベーションを牽引する人材の育成という課題がありますし、実際にプログラムコンテストの世界大会や数学オリンピックで好成績を収めた院生や若手研究者が集まってきてくれています。

ご周知のようにアメリカのヤフー、Google、マイクロソフトといった巨大IT企業は、いずれも自社ラボを構え、その中でリサーチを行う優秀な人材を擁しています。ところが日本では、優秀なプログラマーは多いのですが、アカデミーと同じレベルのリサーチができる企業のラボが基本的には存在しません。逆に大学の研究者も、あまり商業的なものにコミットしていないんですね。このプロジェクトから、世界的に評価されるような基礎研究を行うことができ、かつ実社会への問題にも貢献できる人材を輩出することで、このような状況を変えていくことも重要課題の1つだと考えています。