file 02:学術情報のリサイクル

researchmapのデータは、すべての文字列に対して、これは論文のタイトルですよとか、これは講演ですとかいうことがわかるような「メタデータ」、さらにそれぞれがどこに置かれているかを示す「パーマリンク」が全部書いてあります。だからこそ、他のコンピュータから情報を適切に受け取ることもできるし、他のコンピュータに情報を提供することもできるのです。

しかしこのような「メタデータ」は、機械には有意義でも、人間にとっては入力がたいへん面倒なのは言うまでもありません。そこでresearchmapでは、CiNiiKAKENPubMedJ-GLOBALといった豊富なデータベースプロバイダーと相互に連携することによって、そのようなデータが、特に意識することなく自動的に入るように設計されています。研究者ページへの入力も、すでにある書類からコピー&ペーストしたり、科研費の研究者IDをお持ちの方の場合は、その番号から論文、研究課題、競争的資金、書籍、講演などの情報をワンタッチでインポートすることができます。したがって、手作業による入力の間違いなども起こりません。

一方、所属や科研費の研究者IDの記載なく公開されたような雑誌のインタビュー記事や鼎談などは、それが本当にその人のものなのかどうか、ばらばらになった個人の情報を集める「名寄せ」を行わなくてはなりません。CiNiiなどは「名寄せ」の精度を上げるために日夜努力しているわけですが、機械だけではなかなか最後の10% の精度を埋められないんですね。けれども、researchmapユーザが「これは私です」「これは同姓同名の他人です」と選択していただくことにより、その方の元に名寄せされます。機械学習と人間の判断が連携することによって、こうした課題がスムーズに解決していくわけです。

研究課題、論文、講演、書籍、特許……等々、今まではまったく異なるジャンルに属していたものが、デジタル化によってデータベースに入り、このようなデータベースを経由して、researchmapのそれぞれの研究者の元に集められます。リンクづけされたかたちでデータがまとまることで、融合研究はもちろん技術開発、教育・啓発といったさまざまな目的に合わせて、このデータをリユースし、価値を創出できるようになります。いわば、学術情報のエコシステムが構築されることになるでしょう。