RDF関連メモ on Planet masaka : 2019-10
Planet masakaから2019年10月のRDF/セマンティック・ウェブ関連メモを抽出してまとめたものです。
2019-10-16
- @rjw Schema-org v4.0 schema.org/docs/releases.html#v4.0 メジャー番号が4になったけれども、3.5以降は毎月更新版がリリースされてきて3.9の次を4.0にしただけで、特別な位置づけではないとのこと。メジャー/マイナーという誤解を避けるため、来月はv5、以降同じく整数番号としていくと lists.w3.org...public-schemaorg/2019Oct/...(☞参照) (original post at )
2019-10-15
- 日本写真保存センターの写真原板データベース6753件、約29万トリプル(グラフ単位です)のRDFを #ジャパンサーチ に追加しました。今回、都道府県より小さな単位での正規化を一部試験導入したので、東京.銀座、三重.伊勢市などによる集約が可能になっています jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
- お知らせしてきたジャパンサーチの追加RDFトリプル数は構造化ノード分が抜けていました! グラフ単位で数えると、ARC錦絵696万(先日の記載347万)、ARC古典籍467万(同188万)、魚類写真432万(188万)、LC源氏58万(同29万)、吾妻鏡+歴史物語230万(同120万)各トリプルです。お詫びして訂正します(☞参照) (original post at )
- 人間文化研究機構の吾妻鏡と歴史物語(四鏡+栄花物語)の本文データベース約9.3万件、120万トリプルのRDFを #ジャパンサーチ に追加。やはり各行が1アイテムですが、冊、頁情報を構造化しています。例えば紫式部日記の引用で知られる栄花物語巻8「はつ花」の本文を並べるなら jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
2019-10-10
- 定家本の発見もあったので、源氏物語(米国議会図書館本)の翻字データ約2.6万件、29万トリプルのRDFを #ジャパンサーチ に追加。本の各行が1アイテムですが、丁、巻情報を構造化しているので、それらをたどって一覧できます。例えば若紫 jpsearch.go.jp/rdf/sparql/easy/?query=SE... (JPSには絵入源氏もあります)(☞参照) (original post at )
- 源氏物語の定家本若紫が発見されたというニュースは、このところの仕事ととても近い話題なので、急遽順序を入れ替えてLC蔵版源氏翻字データをRDF化。1行1アイテムの形は見せ方が難しいが、大きなものを分割するよりは小さなものを連結するほうが楽なので、データ利用のためには合理的なのかもしれない (original post at )
2019-10-08
- 国立科学博物館の魚類写真資料データベース約10.8万件、188万トリプルのRDFを #ジャパンサーチ に追加しました。約8割のデータは撮影地の緯度経度付きです。魚の分類をキーワードとして階層化したので、データ中の科名だけでなく、上位の目などからも検索、集約できます。jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
2019-10-07
- ARC古典籍ポータルのデータ約15.6万件、188万トリプルのRDFを #ジャパンサーチ に追加しました。かなり厄介な著者表記もあるていど正規化しています: jpsearch.go.jp/data/arc_books-NDL_2544178 また出版者辞書も拡充したので、上位200程度はそこそこの正規化率を得ています。jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
2019-10-04
- 魚類の分類ツリーはWikidataのP171(parent taxon)をたどればスムーズに生成できるかと思いきや、親が複数定義されていたり、研究の進展で違うツリーになっていたりで、結構苦労した。すごく深い階層もあればあっという間に属まで達してしまうものもあり、味わい深い (original post at )