ちょっとしたメモ

セマンティック・ウェブが目指さないもの

バーナーズ=リーが「WWWの黎明期には“<>だらけのHTMLなんて誰が使うものか”と揶揄された」と述べていたが、今のセマンティック・ウェブも似たようなもので、疑問符をつけたがる人は、少なからずいる。批判は大いに結構。ただし、「信用できない」なんてな感想や見当外れな難癖じゃなくて、建設的な問いかけだとありがたい。

W3Cのサイトに示されている次の一文は、セマンティック・ウェブを語る時によく引用されるものだ。

The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.

「セマンティック・ウェブなんてできっこない」という言説の多くは、どうもこの information is given well-defined meaning という部分を取り違えているように見受けられる。これは、「情報の意味を計算機でも扱える形で定義する」と言っているだけで、「あらゆる概念を表現する標準統一語彙/属性を定める」わけではない。少し補足するなら、「意味を表現する概念やプロパティに一意の識別子(URI)を与えて、計算機が確実に認識・処理できるようにしよう」ということであって、「森羅万象を記述するための標準ボキャブラリを誰かが定める」のとは全然違う。「セマンティクスの標準化」などという荒唐無稽な話ではなく、「セマンティクスを記述するための手段の標準化」を目指そうといっているのだ。

この点で示唆的なのが、バーナーズ=リーの Anyone can say anything about anything. という言葉だ。中央集約的な統一とか標準化というのとは全く逆に、誰がどんな語彙を定義したって構わないというのがセマンティック・ウェブの大きな特徴。といっても、てんでバラバラでは発展性がないから、これらをsubClassOfとかsameAsといった形でつないでいって、意味のネットワークができるようにと、現在いろんな仕様や仕組みが検討されている(これらの仕様がスムーズに機能するのかというのは、真っ当な技術批判ではあるが、セマンティック・ウェブそのものに対する否定ではない)。

W3Cのプレゼンテーションなどでよく取り上げられるセマンティック・ウェブ構築の5つの原則(principles)のうち、Partial Information, Evolution, Minimalist Designという3つまでが、「標準化」批判の対極にあることは、注意を払っておいてもらいたいなぁ(言うまでもないと思うんだけど、忘れちゃってるかも知れないので、念のため復習)。

もうひとつの批判である「普通のユーザにメタデータを付与してくれと言ったって無理」というのは、確かにその通りで、前にも書いたようにツールによるサポートなどの検討が不可欠だろう。ただしこれも、「世の中のあらゆる情報を効率的に検索できる」という神話が先行したことへの反動みたいな要素が強く、セマンティック・ウェブの考え方そのものへの批判にはなっていない。実際、ほんの一握りの語彙で限られたリソースを記述しているだけのFOAFとかRSSだって、それなりに興味深い展開を見せ始めている。もちろん神話とのギャップが大きいことは確かだが、初期のWWWでも、どこかの大学の研究室のコーヒーメーカーを見て感動していたというレベルなんだから、最初はこんなものなのでは。

セマンティック・ウェブというのは、(今のウェブと同じく)完全無欠な世界でもないし、一度に全部が完成するようなものでもない。目指してもいないことに噛みつくのではなく、もう少し面白くてためになる問題提起が欲しいな。

関連メモ:
genre: meta. at