file 01:人の柔軟性と数学の厳密さ

人間の知覚現象と、それを数理的にモデリングすることの間にはとても大きなギャップがあります。しかし単に既存の数学を応用してモデルをつくることができ、錯覚の現象が記述できるなら、研究にならないですよね。それを扱える数学そのものも開拓していかなきゃならないというのが、僕がこのプロジェクトを立ち上げた一番大きな理由です。

線画のような絵を理解するコンピュータを作るというのは、明確な問題であり、比較的数学でアタックしやすいと思うんです。ただそのときに数学をあいまいなものにしてしまったのでは、よくありません。たとえばこういう絵を人間が見ると、三角錐台(三角錐の先端をすぱっと切り落とした形)を見下ろした絵だというふうに、自然と解釈できます(写真参照)。ところがコンピュータで三角錐台であることを認識するのは、実はとても難しいんです。なぜかというと、三角錐台の三枚の平面を延長すると1点で交わるはずなんですが、その点を作図しようとするとないんですよ。画像処理して得た線図形やデザイナーのスケッチなどでは、厳密には立体として成り立っていないことがほとんどです。したがって数学でその立体を探すと、解がない。そういったところが、人間の柔軟性と数学の厳密さとのギャップだと思うんです。

しかし、そのままでは立体構造が取り出せませんから、なんとかしなきゃいけません。すぐに思いつくのは、方程式の「=(イコール)」の部分を「≒(ニアリーイコール)」に置き換えてしまうという方法ですね。するとこういう投影図を持つ立体があることを、コンピュータは見つけ出してくれます。けれども同時に副作用もあって、平面だけで囲まれた立体としてはつくれないと解釈してほしいときにもつくれるという答えが出てきてしまうわけです。なぜなら、「=」を「≒」に置き換えるということは、平面の替わりに曲面を使ってもよいと条件を緩めることに対応するからです。

そうなると正しい絵と間違った絵の区別がつかなくなってしまいますから、ぶち壊しで、数学を使って何かを解決したことにはなりません。厳密な数学だけを組み合わせて、だまし絵に本質的に矛盾があってつくれないのか、それともちょっとした誤差があって、それに目をつぶれば立体としてつくれるのか、その区別をつけることに成功したんですね。そこで使ったいろんな数学的手法を、他の視覚情報処理にも拡げていこうというのが、現在の研究計画です。