XHTML文書の要素に一定の規則に基づいたクラス属性を与えているとき、文書プロファイルにmetaprofを用いればGRDDLでRDFグラフが簡単に抽出できるようになるが、これまでは文書のトピックにURIを付与することができなかった。これを改良する新しいルールを変換スタイルシート追加したので、とりあえずお知らせを。
従来のmetaprof(の変換スタイルシート)の規則は、ブロックレベル要素に大文字で始まるクラス属性値、もしくはdc.
、foaf.
などの特定の接頭辞をつけたクラス属性値を与えておけば、それを適当なRDFの型付要素に置き換えて、文書のトピックを構成していた。たとえば、
(例)
<p class="foaf.Image"
>
<img src="http://..." alt="xxx" />
<span class="date">2007-10-05</span> by <span class="author">masaka</span>
</p>
といった段落があれば、次のようなRDFが文書のトピックとして生成される。
(例)
<foaf:topic>
<foaf:Image
>
<dc:date>2007-10-05</dc:date>
<dc:creator>masaka</dc:creator>
</foaf:Image>
</foaf:topic>
多くの場合、これでも機能するのだが、このように画像について記述するなら、その画像のURIをfoaf:Image
のURIにしたくなるのは当然だ。そこで、この画像要素にclass="about"
を加えると、src
属性の値をトピックの主語として抽出するようにした。つまり、
(例)
<pclass="foaf.Image"
> <img src="http://..." alt="xxx"class="about"
/> <span class="date">2007-10-05</span> by <span class="author">masaka</span> </p>
から次のRDFが得られる。
(例)
<foaf:topic> <foaf:Image
rdf:about="http://..."
> <dc:date>2007-10-05</dc:date> <dc:creator>masaka</dc:creator> </foaf:Image> </foaf:topic>
画像要素だけでなく、a
要素でもclass="about"
があればそのhref
属性を主語URIとして採用する。
(例)
<p class="foaf.Document">
<a href="http://www.kanzaki.com" class="about"
>The Web KANZAKI</a>を読んでみたら、
<span class="description">役に立つことがいろいろとが書いてある。</span>…
</p>
というマーク付けをしておけば、
(例)
<foaf:topic>
<foaf:Document rdf:about="http://www.kanzaki.com"
>
<rdfs:label>The Web KANZAKI</rdfs:label>
<dc:description>役に立つことがいろいろとが書いてある。</dc:description>
</foaf:Document>
</foaf:topic>
というRDFを取り出すことができる。
最近いくつかのページのマーク付けを見直していて、こうした主語URIが必要なケースは少なくないように思われたので、機能追加します。詳しくはまた別途書くとして、取り急ぎお知らせまで。
関連メモ:
- metaprofのブロックレベル要素処理を強化 (2008-01-30)
- GRDDLがW3C勧告案に (2007-07-17)