ジャパンサーチ“利活用スキーマ”の活用
使いやすさと詳細な情報の両立
- 使いやすさ:発見タスクを容易にする
- いつ、どこ、だれ、なにを
schema.org
語彙で直接記述=正規化値 - 名前の正規化と主要LODとのリンク
- SPARQLを知らなくても利用できるEasySPARQL
- 詳細なエンドポイント説明と(非公式)サポートページ
- いつ、どこ、だれ、なにを
- 詳細な情報:識別、選択タスクを確実にする
- schema.orgによる記述に独自語彙での構造化記述を併置=正規化+元データの値
- アクセス情報によるコンテンツへのアクセス(取得タスク)
- ソース情報による来歴の確認(つなぎ役へのリンク)
- 利活用スキーマメタデータ提供の流れ
- 各提供機関(→つなぎ役)
- 連携フォーマット(共通ラベル付与)→ジャパンサーチの通常検索
- 共通の正規化辞書+データセットごとのマッピング定義
- 利活用スキーマのRDFデータ(API提供可のデータのみ)
いつ:時間情報の正規化とEasySPARQL
- 多様な時間記述の正規化
- 「永仁元年十月三日」→
time:1293
- 「明治~大正時代・19,~20世紀 原本:弘長2(1272)年4月銘」→
time:明治-大正
,time:1800-1999
,time:1272
- 「永仁元年十月三日」→
- 時間範囲検索とEasySPARQL
- 複雑なSPARQLクエリを記述せずに、REST API的に時間範囲を検索
https://jpsearch.go.jp/rdf/sparql/easy/?
when=1250,1299
- 検索結果(※元データを一覧に表示するためEasySPARQLによるクエリを加工)
どこ:都道府県と緯度経度
- 都道府県を単位とした正規化
- 直接記述の値を都道府県に正規化→都道府県別でのさまざまな検索を容易に(例:都道府県別特徴クラス)
- 美術館、博物館などの正規化値には位置情報
- 緯度経度とGeohash
- 緯度経度情報を加えると利用されやすい→さっそく利用例:海外も含め緯度経度のある場所を地図表示、標本の位置情報を使った検索・地図表示
- 緯度経度をGeohashを用いてURI化し、上位(広範囲)URIと関連付けることで範囲検索を容易に(エンドポイント解説で紹介しているEasySPARQLを使った範囲検索デモ)
なに:階層クラスとプロパティパス
- クラス階層を利用した網羅的検索
- アイテムのクラス(型)は提供データの分類などに基づくため、ばらつき:「絵画等」「絵画」「版画」など
- クラスを階層的に定義 → SPARQLのプロパティパスで階層をたどった一括検索
?type rdfs:subClassOf
*
type:絵画rdfs:subClassOf
の後に*
(0回以上の繰り返し)を加えることで、絵画クラス自身とそのサブクラスを一括検索できる
- 「神奈川県の絵画とそのサブクラス」を検索
だれ:正規化とリンク
だれ:ジャパンサーチ名鑑
- 非公式サポートと日英名鑑
- 公式サイトでは提供しにくい情報を非公式サポートページで提供
- 正規化辞書に基づくジャパンサーチ名鑑。またモデル/エンドポイント解説なども
- Japan Search normalized name index(英語版の名鑑)
海外MLAとの横断検索
- SPARQLの統合クエリを用いた横断検索を実現
- 名前正規化 → DBpediaなどLODとリンク → 海外MLAもLODとリンク → 統合クエリ(横断検索)が可能
- 統合クエリの記述は、各エンドポイントのモデルも理解する必要があり、かなり複雑
- サポートページでは名前の入力で統合クエリを簡単に実行
- 歌川豊春を英国博物館と横断検索