ちょっとしたメモ

SKOSの新草案

SWBPのプロジェクトという位置づけで草案が公開されていたSKOSが、W3Cの標準化トラックに乗って、改めて最初の草案 SKOS Simple Knowledge Organization System Reference が公開された。シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙+モデルで、個人的なカテゴリや分類方法を体系化するのにも使える。さまざまな領域において、すでに多くのシソーラスや用語集が構築されているわけだが、これらは必ずしもOWLなどでそのままクラス体系として記述できるとは限らない。こうした知識や情報を、無理なく「セマンティック・ウェブ」に組み込むモデルとして、SKOSの果たす役割はかなり大きいのではないかと期待される。

SKOSでは、シソーラスや分類で扱う「術語」を、OWLのクラスではなく、概念リソース(Conceptual Resource)として扱う(skos:Conceptクラスのインスタンスになる)。概念リソース同士の関係は、上下関係ならskos:broaderskos:narrower、参考関係ならskos:relatedとして表現される(シソーラスのBT、NT、RTと同じ)。前者はOWLクラスのサブクラス関係と似ているが、クラス階層は属関係(継承の関係、is_a関係)しか扱えないのに対し、skos:broaderskos:narrowerは全体部分関係やインスタンス関係も扱えるという柔軟さがある。

たとえば、カテゴリとして「日本」と「東京」を考え、前者を後者の上位カテゴリにするというのはごく普通だろう。しかし、これらをowl:Classとして扱い、ex:東京 rdfs:subClassOf ex:日本 .としてしまうのはおかしい。東京は日本の一部(全体部分関係)であって、日本の一種(is_a関係)ではないからだ(さらに、「日本」をクラスというよりも、「国家」クラスのインスタンスと考えるほうがよさそうだ)。SKOSならこれらを

(例)

ex:東京 skos:broader ex:日本 .

とそのまま記述できる。多くの既存のシソーラスは、クラス体系にするためには大工事が必要になるが、SKOSならほぼ機械的にRDFに移し変えることができるわけだ。

新草案では、SWBP時代には別の仕様に分けられていた、異なるシソーラス(SKOSでは概念スキームと呼ぶ)の術語をマッピングする語彙も組み込まれた。国会図書館件名標目の「セマンティックウェブ」とWikipediaの「セマンティック・ウェブ」が同じ概念を表しているなら、

(例)

ndlsh:セマンティックウェブ skos:exactMatch wikipedia:セマンティック・ウェブ .

という記述で両者を関連付ければよい。これをowl:sameAsで結びつけると、両者は全く同一のリソースということになり、いろいろと問題が生じてしまう。SKOSはOWLで火傷をしないための回避策を随所に盛り込んで、その点でも既存知識体系を活用しやすくしている。

OWLのクラス体系と、インスタンス間の関連付けの違いは、それなりにRDFを使っている人も混乱しやすいところなのだが、このSKOS仕様書はその部分を的確に説明しており、特に第1章は入門学習素材としても使えそうな感じだ。RDFの予備知識が全くないと少々辛いかもしれないけれど、最初に記したように、実用的な知識システム構築用の語彙としても期待が持てるので、読む価値ありだと思う。

(※SWBPの旧SKOSを使っていた人は、語彙の削除追加を含むかなり大きな変更が加えられているので、要注意。ちなみに名前空間はそのまま)