music & knowledge sharing
属性=値ペアとしてのデータ
- 奥付、商品ラベルなど身近なデータ
- データの意味を整理すると
図番号 | 何の | 属性 | 値 |
1 | この本の | タイトル | セマンティックHTML/XHTML |
2 | この本の | 著者 | 神崎正英 |
3 | この本の | 発行所 | 株式会社毎日コミュニケーションズ |
4 | 毎コミの | URL | http://book.mycom.co.jp |
5 | この本の | ISBN | 978-4-8399-3195-7 |
「何の」を加えたトリプル・モデル
- データの主語を明示する
- 手元の情報なら暗黙の主語(この本)で属性=値ペアの意味は分かる
- 汎用的に扱う情報は属性=値ペアだけでは区別がつかない
- 主語を加えた三つ組(トリプル)によるデータモデル
- 有向グラフによる三つ組モデル
- 「何の」(主語)と属性値をノードとし、属性を表す矢印で結ぶグラフ
グラフの連結とURI
- 同じ名前(ラベル)をもつノードは連結できる
- グローバルな名前:URI
- 「同じ名前」といえるのは文脈が共有できる時のみ
- グローバルな文脈(ウェブ全体)で共有できる名前=URI(Uniform Resource Identifier≒URL)
- トリプル各部の名前にURIを用いれば、ウェブ上で同じ名前を持つグラフがつながる
RDFとリンクするデータ
- RDFとは
- Resouce(リソースの)Description(記述方法の)Framework(おおまかな約束)
- トリプル各部の名前にURIを用いたグラフによるものごと(リソース)の記述法
- RDFの利点
- 複雑な情報も単純なトリプルに分解して標準的に表現・処理できる
- URIを介して異なる領域のデータでも連結=共有できる
- URIさえ同じなら、事前調整がなくてもデータが連結できる(個別の意味はあとで調整でもよい)
- リンクするデータ(Linked Data)とは
- RDFの名前付けに用いたURIをURLと読み替えることで、データの記述でもハイパーリンクを活用しようというティム・バーナーズ=リーの提案
- RDFの処理アプリケーションが、リンクを辿って新しいデータを発見できる
- 文書のウェブがハイパーリンクで広がったように、データのウェブもリンクによって広がる
- グラフと文脈
- 単純化されたデータ
:whisky :alcohol "42%".
→ メーカー/消費者、製品の背景によって受け止めが異なる
- 他のデータと組み合わせ、グラフによる文脈情報を得られるようにする
- 「どのグラフに由来するデータか」という情報を保つ=名前付きグラフ(グラフ名を加えた四つ組)
漢字のRDFグラフ表現
- 漢字構成要素とIDS/IDC
- 「辻」を“左下に「⻍」そして「十」”と捉えて表現 →
⿺⻍十
- ⿺⻍十という関係をグラフとしてRDFで表現できる
漢字表現とリンクするデータ
- たとえば公開漢字部首データベースを複数の漢字情報が参照する