人工知能は価値を創造できるのだろうか？

東京大学

原田達也教授

人工知能の研究は、留まるところを知らないとまで言える様相だ。多くの仕事、作業が機械に代替されるという予測は、ますますリアリティを増してきたようである。今後、人工知能の活躍の範囲が広がっていくことは間違いないとしても、ある種の万能観を持って語られるムードには、違和感がつきまとう。機械によってできること、できないことが錯綜してはいないだろうか。できることはどこまでで、その先はなぜ難しいのだろうか。人工知能研究に深く関わる研究者が考える、分岐点と展望はどのようなものなのだろう。東京大学の原田達也教授に聞いた。

◎「人工知能は、なんでもできるの？」という問い

コンピュータが小説を書き、絵画を描き、音楽を作る。機械に取って代わられる職業がリストアップされ、雇用の減少を招くという予測が出る。自分の職業はどうなるのだろう？　という思いでその表を見つめた人も少なくなかったはずだ。今年（2016年）3月には、世界で最も強いとされるプロの囲碁棋士が人工知能に敗戦を喫するというニュースが流れ、マスメディアはそれを「衝撃」と表現した。かつて、機械化やコンピュータ化は重労働や単純作業から人間を解放してきた。しかし、人の思考や価値の創造を扱ったり、ゼロからものを生み出したり、芸術を創造するのは人の得意分野であり、機械とは一線を画する仕事だという考え方も根強い。それでも、人工知能がこれらのことまで扱えるようになる日がそう遠くないところまで迫っているように見える今、人工知能はどこまで可能なのだろうかを改めて考えてみたい。その問いに冷静に対峙するにはどのような考え方が必要なのだろう。

ページトップへ

◎ジャーナリスト・ロボットという挑戦

東京大学の原田達也さんが研究するのは、「ジャーナリスト・ロボット」である。インターネット等の発達により世界のニュースを瞬時に入手することが不可能ではなくなった。しかし、遠い世界の出来事ではなく、身近に起こる興味深い出来事を高い信頼性を担保して入手することはむずかしい。それには、膨大な取材と記事の供給が求められるためである。集めたデータの中から、必要かつ「価値ある」ニュースをピックアップすることも重要。それらの作業をロボットが行うという想定である。人や社会にとって重要なことや意味のあるできごとを見つけ、解釈して問題意識やストーリー性を持たせ、受け手に伝える。時には世論を形成する仕事。そこには、社会が置かれた状況や、時代、国や地域の個別の事情、そこに住む人の価値観やそのときの関心事、歴史に照らし合わせて価値があるのかを吟味する過程がある。これを、ロボットで行うという試みは、機械がどこまでの仕事をするのかを考え、想像し、疑問や思考のポイントを考える題材として魅力的だ。原田さんが考えるジャーナリスト・ロボットの動作プロセスは、自律的に取材を行い、被写体を適切に配置した写真を撮影する。まずは、ニュースの発見、それに続いて状況認識を行い、必要があればインタビューの質問を考えたうえで適切に選択して近くにいる人に質問を投げかける。最終的には、ニュース事象の写真、記事、インタビュー対象の顔写真を掲載して、「記事」を作る。人間の記者が、知識や経験の蓄積、それに基づく直感によってニュースを探し出すように、ロボットは、「ニュース性」を抽出するのだろうか。

ジャーナリスト・ロボットは、膨大な画像データを蓄積して「異常」を見極める。例えば、部屋の中を歩き回り、いつもは落ちていない紙やゴミ、いつもと違う場所にあるイスや机があるとか、人が倒れているなどといった日常と異なる部分をピックアップするという。「人が倒れている」という日常あまり見かけない光景を異常と見極めることは比較的たやすいかもしれない。しかし「いつもと違う」状態は、一見「異常」と認知されない中にも存在する。テーブルの上のカップの位置が少しずれている、ということは一般的に異常とは見なさない。その逆にそれほど位置が変わっていなくても、カップの中のお茶がこぼれているということであれば、それは位置や状況の変化以上にただならぬ事態と捉えるだろう。近くの書類が汚れる、服を濡らすといった将来の予測までもが異常の要素となり得る。ロボットが蓄積すべき日常の状態に加え「価値観」のインプットも必要となる。

ここで興味深いのは、ロボットがインタビューに使うマイクである。このロボットは腕を備え、その先にハンドマイクを「持って」いる。マイクが音源から遠いと期待される音声認識処理の精度が低い。ところが、マイクを人に差し向けていることで、インタビューされた人が無意識にマイクに向かって話してくれる。こうして質の高い音を記録することができるのだという。なるほど、見慣れたマイクの形をインターフェースとして、人間の感情や気持ちに依拠しているところは、ロボットの機能として興味深い。

「ジャーナリズムとロボット」の組み合わせでは、AP通信社の「ロボット・ジャーナリズム」の例がある。これは、アメリカ国内の企業の収支報告などを元に重要な情報を選び出し、即座に新聞や雑誌の体裁で150～300字程度の記事を書くというもの。記事１件の作成時間は1～2秒で、企業業績の記事本数が飛躍的に伸びたと報告されている。これはこれで、画期的なことだが、データ中心で定型の記事であればロボットでも可能だということにさほどの驚きは感じない。しかし、事件性の検知や世論を二分する内容、発表されない真実を追究する調査報道までは、ロボットでは対応できないということは多くの人が感じているところだ。ここで浮かび上がるのは、データと定型を基本とした経済記事と、真実を追究するジャーナリズムのあいだのどの部分までがロボットに可能なのだろうかという疑問である。それは、ジャーナリズムだけではなく「データ処理」と「表現活動」の狭間で人工知能の可能性を探ることにも通じるはずだ。

原田さんは、日常と違うことやなにかおかしなことを検知するのであれば、ログをとり蓄積することである程度は対応できると考えている。もちろんそれは膨大な量になるだろうがそれらを検索し活用することができれば不可能ではない。また、人の思考や価値観などもデータとしてインプットすることは可能だと考えている。ライフログを取ることができれば、その内容から、考え方や傾向、行動パターンなどを割り出しモデル化することができる。ただし、思考や価値観は人の内面からわき上がるものであり、内面を捉えたものとして扱ってよいかどうかには、慎重な姿勢を崩さない。人の内的な状態はわかり得ないので、完全にモニターすることは難しいのではないかというのが現在の原田さんの考え方だ。ジャーナリズムだけではなく、映画監督が映画を撮ったり、漫画家が漫画を描いたりするといったような創作についても、ロボット自体の中にわき上がる動機が必要。これは、データを集めるだけでは実現できない世界だろうと考えている。

ページトップへ

◎数値モデル化できるか否かが分かれ目なのか？

「ものの動きや変化をコンピュータで計算できるよう数値化したモデルがあれば、精度やスピードを向上させることはできます。しかしこれは、いってみれば試験で70点だった点数を90点に上げるという場合において有効だという意味です。膨大なデータとその活用によって合格ラインに届くようにすることはできるでしょう」と話す。「でもまったく何もない状態、0点から70点にするのは数値モデルという手法で扱うのはむずかしいでしょう」。モデル化以前に、求めるものを実現するために必要な「認識」を、実世界からいかに取り出すことができるかどうかも見逃せないポイントだ。私たちは、目の前に起こっていることの情報をさまざまな角度から取り入れる。例えば、「人が腰掛ける」ということひとつとっても、どのような状態から腰掛けたのか、座ったものはイスなのか、台なのか、それとも岩のようなものなのか、そして座る目的は何か？　具体的な「モノ」を表現するのであれば、それを表す言葉を記号として投入すればよいが、前後の状況や思い、雰囲気などを扱うことは得意とは言えない。

例えば、「雪の降りしきる夜の隅田川。１人の船頭が客に頼まれて渋々と船を漕ぎ出す。屋形のなかでは、こたつで温まる２人の客。墨を流したような白と黒の情景の中に岸が遠のき、襟に吹き込む冷たい風をこらえて、櫓を１回、２回と漕いで進む」こんな古典落語の情景からデータを取り出すとしたら、船、川、雪、夜、寒いといった叙事詩的な要素であれば簡単だ。しかし、「気が進まないのに渋々と」「客はのんびりしているというのに、この寒さの中、船を漕ぐ我が身を恨めしく思う」「早く仕事を終えて暖かいところに戻りたい」などの叙情的でありつつ、実は噺の根幹に近い情報をどのように表現していくのかという課題をクリアするのは、難しいとみる。

世の中の現象を数字で表現してモデルを作り、世界をシミュレーションする方法が、コンピュータ研究の初期の頃に登場した。これを発展させることによって、森羅万象を理解し、データ量を増やし、データの質を高め、処理量と速度を上げてきた。今、価値の創造や動機までも射程距離に入ったかのようだ。しかし一方で、数値モデル化することによって取りこぼさざるを得ない要素の大きさにも気づく。「数学的に抽象的な概念を構成して、現象を切り取っていく。身の回りの現象を濾過し、求めるモデルを確立してそれにより現象を説明しようとする。その数学的なアプローチは強みである一方、その世界は色もなければ音もないという大変味気ない世界である」という朝永振一郎博士の言葉にあるように、情報を捨象してこそ得られるモデルに依存しながら価値の創造を行おうとすることを一歩立ち止まって考える時なのだろう。

原田さんは、基本は人のように柔軟に実世界を認識する知能システムを作りたい、と考えている。それを目指すからこそ、岐路や限界に対して敏感でなければならないともいう。その一方で、必ずしも「人」が到達点ではないという柔軟さも同居している。人の持つ知能の素晴らしさを十分認識した上で、必ずしも人が最高であってそれにこだわっているわけではなく、機械は機械として持つべき知能があると考えているのである。人は、たまたま進化の過程で今の段階にいるだけであり、視野を大きくすれば人の知能は局所解に陥っている可能性も否定できない。裏返せば、本当はもっとすごい知能となる大域的な解がある可能性を感じているともいう。

人間や生物の体や精神が複雑さを体得することによって獲得している機能、例えば、中耳や内耳の構造が複雑であるように、複雑さを持つことによって体得している機能があったとしたら、それは進化の過程でできあがったものである可能性もある。そのようなプロセスを飛び越えて、シンプルな構造で同じかそれ以上の機能を持つことができる、機械にはそんな可能性もある。知能においても、よりシンプルで高機能なものを研究することには魅力を感じているという。到達点の向こうの風景も見据えながら、現状を分析するという、視点を変えた見方が必要なときに来ている。

ページトップへ

ご意見や感想をおくる

researchmap 研究者ページ：原田達也

つながるコンテンツ

人工知能は価値を創造できるのだろうか？

◎「人工知能は、なんでもできるの？」という問い

◎ジャーナリスト・ロボットという挑戦

◎数値モデル化できるか否かが分かれ目なのか？