music & knowledge sharing
リンクするデータ
- Linking Open Data
- つながりあう機械可読データは続々と増えてきている(LOD Cloud)
- FOAFで記述された人物データ、DBPediaなどの概念マップ、Geonamesなどの固有名etc.
リンクするデータとRDF
- データをRDFで記述する
- 共通の基本モデル(トリプル)による基盤
- 事前の合意なしで複数のデータソースがつながる
- サービスごとに異なるAPIに対応する必要がない
- 推論可能なスキーマを用意する
- 明示されていない関係が推論できる
- 簡単なクラス階層、サブプロパティ関係でも効果は大きい
CiNii型著者モデルの特徴
- 著者を実体(foaf:Person)として表現
- 著者と組織を関連付けられる。そのほかの関連情報へのリンク(外向き)も可能
- ⇔著者をラベルで表すだけでは、グラフはつながらない
- 著者が空白ノード
- 集約、このノードへのリンク(内向き)ができない。検索は、現状では氏名を使うしかない
- 何を著者のURIとするか。科研費ID? メールアドレスをIFPとして?
- 既存モデルとの違い
- 著者をラベル(リテラル)と考えているアプリケーションには扱えない(CiNiiは、このためにdc:creatorで別途ラベルを提供している)
- 著者をfoaf:makerの直接目的語と考えているアプリケーションにも検索できない
- コレクションのノードは、現状では標準的な(SPARQLの)検索方法が無い
CiNiiとリンクするデータ
- リンクするためには識別が必要
- URIで識別されたリソースに対してリンクできる(空白ノードにはリンクできない)
- 識別だけでなくRDFデータを取得できるようにすれば、さらに次のリンクがつながっていく
- 識別されるもの(論文、著者)と、そのRDFデータ(ウェブ文書)を混同しないこと。Cool URIs for the Semantic Web
- CiNii論文データのURI
- 論文は
http://ci.nii.ac.jp/naid/論文ID#article
http://ci.nii.ac.jp/naid/論文ID/rdf
からはRDFデータを取得可能
- 組織は
http://ci.nii.ac.jp/org/組織名
(暫定?)
- 著者は…現在は空白ノード
- リンクするデータになるのは、リンクしたいデータはどれ…?
集中と分散
- URIはオーソリティが割り当てるべき?
- オーソリティによる割り当ての方が、永続性などの面で安心して使える。たぶん探しやすい
- 標準化は大変かも知れないが、基礎はおおむね典拠ファイルなどとして整えられている
- 一方で、情報を分散化すれば、URIも分散しやすい
- 開世界において、どのURIを同じものとみなすか、どうすればシステマティックに運用できるか
- コンテンツの集中と分散
- 集中する方がデータの整合性が比較的高い
- 分散する方が、おそらく情報は新しく、詳しい
- インデクス、カタログなどは集中化、コンテンツ(論文や個人プロファイル)は分散データという組み合わせはあり得る
- 分散化、あるいは自己申告の場合の信頼性/SPAMの問題をどうするか
参照先
- 参照したリソース
- LOD Cloud, , つながりあうデータのクリッカブルマップ
<http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2008-09-18.html>
- DCMI Metadata Terms, , DCMI Recommendation
<http://dublincore.org/documents/dcmi-terms/>
- Publishing Requirements for Industry Standard Metadata
<http://www.prismstandard.org/>
- FOAF Vocabulary Specification, by Dan Brickley, Libby Miller
<http://xmlns.com/foaf/spec/>
- RDF Primer 4.2 RDF Collections, , W3C Recommendation
<http://www.w3.org/TR/rdf-primer/#collections>
- Cool URIs for the Semantic Web, , W3C Interest Group Note
<http://www.w3.org/TR/cooluris/>
- 評判のオントロジーとFOAF,
<http://www.kanzaki.com/works/2007/pub/0125intap.html>