ジャパンサーチSPARQLクエリ集
ジャパンサーチのクエリ例として、とりあえずTwitterに投稿したものから(後日また改めて整理します)。
- 構造化ノードのschema:characterNameを用いた検索 映画作品は出演者とその役割も構造化しており、たとえば「伊豆の踊子」各作品での“薫”役一覧なども(国立映画アーカイブ所蔵映画フィルム検索システム)。
- サブクエリで抽出した値を利用する受賞監督作品集約 また把握できる範囲でWikidataやキネマ旬報のベストテンと関連付けたので、日本映画監督賞/1位作品監督の作品の一覧も可能です(国立映画アーカイブ所蔵映画フィルム検索システム)。
- 媒体と内容などの階層構造を用いた集約 掲載媒体と広告内容、さらに出版物なら巻号をまたぐシリーズといった複数レベルの要素→フラットな元データから構造化し、媒体別集約 、広告内容のシリーズ別集約など可能に(明治期出版広告データベース)。
- isPartOfを用いたコレクション集約 指定区分やコレクション名を利用して型(クラス)を付与した他、コレクションURIをisPartOfで加え、集約を可能にしました。accessInfo/urlから歴博Khirinの詳細ページにもリンクしています(歴博館蔵品目録)。
- ライセンスの構造化記述とプロパティパスを利用した集約 …今回の更新で、大半のデータセットにjps:accessInfo/schema:licenseを付与しました。これを用いて、商用利用可能アイテムの検索などができます (CC以外にも展開予定)。
- NDCの分類階層とプロパティパスを利用した検索 全国書誌、NDLデジタルコレクションのデータを再変換し、情報を拡充しました。強化点の一つは日本図書館協会のNDC-LDとの関連付け。これにより例えばNDCの(版を問わず)7類に該当する資料を要目別に集約できます。
- 正規化辞書とschema:memberOfによる女房三十六歌仙の和歌検索 歌人3291人を辞書登録して正規化、うち38%をWikidataにリンク。さらに三十六歌仙などの情報も加えています。例えば女房三十六歌仙の勅撰歌(二十一代集データベース)。
- jps:regionを用いた場所情報集約 都道府県より小さな単位での正規化を一部試験導入したので、東京.銀座、三重.伊勢市などによる集約が可能になっています(写真原板データベース)。今回の拡張正規化は、都道府県の他に市郡を判定できたときplace:三重.伊勢市のような形でURI化し、場所構造化ノードからjps:regionで関連付ける形です(正規化値jps:valueを置き換える方法は、都道府県別集計が複雑になるなど、あまり芳しくなかったため)。
- 構造化したpartOfによる並べ替え 各行が1アイテムですが、冊、頁情報を構造化しています。例えば紫式部日記の引用で知られる栄花物語巻8「はつ花」の本文を並べる(吾妻鏡と歴史物語の本文データベース)。
- 階層化キーワードとプロパティパスを用いた集約 約8割のデータは撮影地の緯度経度付きです。魚の分類をキーワードとして階層化したので、データ中の科名だけでなく、上位の目などからも検索、集約できます(魚類写真資料データベース)。
- 浮世絵の絵師による集約 絵師、版元、配役などをできるだけ正規化し、データをつないでいます。たとえば絵師上位200の検索結果。新しい試みとして、浮世絵に描かれた役者をagentialで構造化し、そこに配役をschema:characterNameで組み込みました。(ARC浮世絵ポータル)。
- 小学校学習指導要領(社会)に出てくる人物に関連するアイテム小学校社会科で学ぶ人物に関するアイテムを調べることができます
(学習指導要領LODの一部をジャパンサーチのエンドポイントに取り込み、第6学年の2-(2)-ア「我が国の歴史上の主な事象に関する内容」に記される人物(3-(2)-ウに示される42名)を項目(ア)~(コ)ごとに
schema:about
でジャパンサーチ正規化名に関連付けています)。