ちょっとしたメモ

Dublin Coreの新仕様案に対するパブリック・コメント

先日のExpressing Dublin Core metadata using RDF草案に対するパブリック・コメントが6月末で締め切られ、そのまとめがDCRDFTaskforce/PublicCommentJune2006として公開されている。決定的な異論は無かったが、いくつか調整や修正が必要ということだ。問題の定義域、値域に関しては、抽象モデルに沿って進めるが"needs some improvement"というのが大方の意見か。

コメント公開ページの内容は、概ね次のようなところ。

DCプロパティに定義域と値域を与えることについて
この点については、いくつかの懸念が表明された(当然だ)。dc:creatorなどは、以前のDCMIの説明でもリテラル扱いだったし、Swoogleの統計を見てもDCMESの15要素の大多数はリテラル目的語として使われているから、これらが不適合になるというのは問題が大きい。また、定義域、値域という考え方はDCの抽象モデル(DCAM)にも存在しない。DCAMとの整合性も含め、この件はもう少し議論、改良が必要で、定義域、値域は基本15要素を除く精密化要素に限るという提案も出された。
エンコーディング・スキームとRDFの関係
以前からあったvocabulary encoding schemes (VES)に関する議論が再燃。過去の勧告やDCAMではVESは「値のタイプ」とされており、今回の草案ではrdf:typeによって表現するようになっているが、VESの慣用的な機能は「値が統制語彙から取られている」ことを示すもので、これはRDFのクラスとは必ずしも一致しない。実際、rdf:typeで型付きノードにした上でvalue stringを型付きリテラルにするというのはモデルとしてもいまいちなので、この辺りの整理と明確化が求められている。
rdf:valueについて
草案ではエンティティのリテラル値はdcrdf:valueStringで表現するとしていたが、rdf:valueでいいのではないかという意見。その方が互換性や相互運用性もいいわけだし、分かりやすいから、dcrdf:valueStringは撤回される可能性が高そうだ。
型付きリテラルを用いることについて
"The use of literal strings as direct values of RDF properties is still not fully understood." とか言ってるけど、そりゃあのモデルでは混乱するだろう。VESの件と合わせて整理が必要なことは明らか。
dc:type vs. rdf:type
dc:typerdf:typeの役割がかぶっているんじゃないかという議論。dc:typeの値域の案が「クラス」となっているので、なおさらということだ。しかし、OWL DLではプロパティ値をクラスにすることはできないのだから、基本的にこの値域の案はアウトだと思うけどね。
The use of rich representations(入れ子表現)
どうでもいいのでパス。
構文エンコーディング・スキームと言語タグを同時に記述していいのか
DCAMでいうところのsyntax encoding schemeはRDFのデータ型に相当するが、DCAMではこれを言語タグと同時に記述できることになっている。RDFでは、型付きリテラルは言語タグを持つことはできないので、矛盾するのではという話。これも当たり前なので、たぶんDCAMの方を調整することになるのだろう。

DCAMに従って基本的にはプロパティ値をエンティティとするが、値域に関してはもっとよく議論しようと。定義域、値域は基本15要素を除く精密化要素に限るというのも、現実解としてはあり得る。dcrdf:valueStringを止めるというのは歓迎。あとの話は当然というか、そうでなければRDFのモデルと矛盾してしまうわけで、議論するレベルではない感じだ。

関連メモ:
map - genre: rdf. at