RDF関連メモ on Planet masaka : 2019-05
Planet masakaから2019年5月のRDF/セマンティック・ウェブ関連メモを抽出してまとめたものです。
2019-05-31
- 関連して、SPARQLの「ボトムアップ」評価のため、{}の外側のBINDやVALUESはサブGGP({}内)に見えないという問題がBlazegraphのドキュメントで指摘されていて wiki.blazegraph.com/wiki/index.php/SPARQ... かつそれが実装(Virtuosoでは動く)や最適化(Blazegraphも可能なものはトップダウンにしている)によっても違ってくるというややこしさ(☞参照) (original post at )
- 前投稿の最後は、SERVICEに送るVALUESは結果セット制約だけで、グラフパターンの変数を置き換えてくれないのではということ(仕様 www.w3.org/TR/sparql11-federated-query/#... Wikidata→JPSのクエリがまさにこうなっている)。SERVICE側はパターン一致全結果を取り出した上でJOINして返す=重い上に結果が異なることも(☞参照) (original post at )
- ちなみにSchema-orgの拡張方法は、従来サブドメインを用いてbib.schema...のような形にしていたけれども、よりシンプルにするため、この春からサブドメイン無し(コアと同じ)URIに変更されている lists.w3.org...public-schemaorg/2019Mar/...(☞参照) (original post at )
- BiblioGraph-net Vocabulary Deprecated lists.w3.org...public-schemaorg/2019May/... 書誌をschema-orgベースで記述するときの補完語彙としてWorldCatなどでも用いられたが、schema-orgのbib拡張に事実上吸収されていたので、ここで明示的に非推奨にすると。お疲れさま>bgn:(☞参照) (original post at )
- Welcome Japan Search to the web of Linked Open Data blogs.bodleian.ox.ac.uk/digital/?p=1598 ボドリアンの招聘ウィキメディアン@mlpoulterから、ジャパンサーチをWikidataの統合クエリ対象リストに追加→横断検索や別言語対応付けができると紹介(VALUESの変数よりSERVICE側に直接URIを記述するほうがよさそう)(☞参照) (original post at )
2019-05-30
- なぜ(W3C勧告の)SHACLではなくShExなのかという問いに対して:より広い実装の選択肢、コンパクト構文、Wikidata文化とのコミュニティの親和性など。制約を課すのではなく、異なるシェイプを顕在化して比較可能にするなど。統合クエリが書きやすくなるというのも重要 lists.wikimedia.org/pipermail/wikidata/2...(☞参照) (original post at )
- Standardizing on XSD 1.1 datatypes - sparql-12 Issue #93 github.com/w3c/sparql-12/issues/93 紀元前1年がXSD1.0では"-0001"^^gYear→1.1で"0000"に変更、SPARQLも1.0と1.1で同じく違う件を、1.2で整理しようと。VirtuosoもARQも"0000"はエラーになるためジャパンサーチでは1.0形式を用いたのだが、悩ましい(☞参照) (original post at )
2019-05-29
- WikidataでのShEx利用がスタート www.wikidata.org/wiki/Wikidata:WikiProje... SPARQLクエリで取得した対象から自動的にShExを生成するツールの試験版も tools.wmflabs.org/wd-shex-infer via @wikidata twitter.com/wikidata/status/113340685865...(☞参照) (original post at )
2019-05-28
- Integrating Wikidata at the Library of Congress blogs.loc.gov/thesignal/?p=28985 米議会図書館の名称典拠(NAF)と件名典拠(LCSH)で約100万件にWikidataへのリンクを追加。Wikidata側でP244を登録するとLCにも反映されるという仕組みらしい (original post at )
- The Semantic Web identity crisis: in search of the trivialities that never were ruben.verborgh.org/articles/the-semantic... SWコミュニティは課題の80%は理論的研究で扱えるとしてきたが、エンジニアリング対象とした20%が実際のウェブにつなぐために不可欠であり、欠落していた。フロントエンド開発者たちはシンプルさを重視してきたが、異なるデータをつなごうとすると結局SWが考えてきたのと同じ問題に直面する。データを集約してビッグデータ的に扱うのは、利点もあるが、それぞれの持っていた細部が失われる。SWは分散した多様性をセマンティクスでつなぐところに立ち戻るべき。ML lists.w3.org...semantic-web/2019May/0085...(☞参照) (original post at )
- Graph Standardization Business Group www.w3.org/community/graph-standardizati... 3月に開催されたグラフデータ標準化WSを受けて、組織/機関のグラフ利用UC、対象技術領域選定などのためのBG設立。プロパティグラフのコア定義などは外部で→相互運用性のため連携模索。WS報告は www.w3.org/Data/events/data-ws-2019/repo...(☞参照) (original post at )
2019-05-27
- Designing a Linked Data developer experience ruben.verborgh.org/blog/2018/12/28/desig... フロントエンド開発者にLD(URIによる分散)を理解してもらい、Solid上でReactやLDflex(RubenによるJSのDSL)でややこしいことなしにアプリケーションを作れるようにするべきというRubenの記事。これを紹介する投稿から議論スレッドも lists.w3.org...semantic-web/2018Dec/0173...(☞参照) (original post at )
- Semantic Web Perspectives lists.w3.org...semantic-web/2019May/0081... 先々週答えたアンケートの結果まとめ。問題点上位:使えるツール/インセンティブ不足、データ品質と信頼性、仕様(特にOWL)の複雑さ。サクセスストーリーのキーワード上位はSchema-org、知識グラフ、Wikidataなど。含詳細分析=SWJ投稿論文リンク (original post at )
2019-05-24
- ジャパンサーチのギャラリー関連グラフ www.kanzaki.com/works/ld/jpsearch/galler... ギャラリーデータをWeb Annotationとして記述するとともに、関連ギャラリーのつながりもRDFに追加。SPARQLクエリを用いてグラフ表示してみると、ほとんどのギャラリーがつながることが分かります(☞参照) (original post at )
2019-05-21
- RFC8615: Well-Known Uniform Resource Identifiers (URIs) tools.ietf.org/html/rfc8615 諸事情により特定のURIパスを前提として共有するための約束RFCが、セキュリティ面中心に記述を詳細にして(FAQまで加えて)更新。現在40の共有名がIANA登録済み(☞参照) (original post at )
2019-05-19
- Shape Expressions arrive on Wikidata on May 28th lists.wikimedia.org/pipermail/wikidata/2... WikidataがShExを導入して(タイプごとの)スキーマを定義し、整合性チェックや新項目作成時のテンプレートなどでの利用を想定と。これは面白いことに(☞参照) (original post at )
- マイノート→Web Annotation変換用ブックマークレット www.kanzaki.com/works/ld/jpsearch/annot-... ノートをエクスポートしてからツール貼り付けて変換というのは手間がかかるので、ギャラリーと同様に #ジャパンサーチ のページから変換ツールを呼び出すブックマークレットを用意しました(☞参照) (original post at )
2019-05-18
- ジャパンサーチ・ギャラリーとWeb Annotation www.kanzaki.com/works/ld/jpsearch/galler... ギャラリーのデータ構造はマイノートと基本的に同じなので、応用編としてこちらも外部からの注釈記述に変換するツールを。ギャラリーのテーマを拡張/詳細化して、独自の注釈集を作る出発点にできるかもしれません(☞参照) (original post at )
2019-05-16
- RFC8594: The Sunset HTTP Header Field tools.ietf.org/html/rfc8594 何らかの理由である時期からURIが応答できなくなることが予め分かっている場合、応答ヘッダのSunsetフィールドでその日時を示す(期間限定なのは閉鎖ではなくURIの方=前I-D説明不適切)。リンク型rel=sunsetで説明ページを示す方法も(☞参照) (original post at )
2019-05-15
- Embracing Data Silos: Semantic Search and Analytics Innovation www.dataversity.net/?p=326508 LeapAnalysisのCEOエリック・リトルへのインタビュー。高コストなETLで中央DBに変換するのではなく、UIとデータサイロの間に知識グラフ層を置いて、SPARQLで問い合わせ、抽出や視覚化などを行なう。VKGという言葉こそ使っていないけれど、考え方は基本的に同じ(☞参照) (original post at )
- Virtual Knowledge Graphs: An Overview of Systems and Use Cases www.data-intelligence.org/p/24 仮想知識グラフについて、概念、ツール、ユースケースが紹介されている。要は既存のRDBMSを直接統合するのではなく、R2RMLなどを用いてRDFにマッピングし、(企業の)知識をオントロジー化したものと組合せることで無理なく柔軟に統合するというもの。動的グラフだからツールの最適化が重要になる。ほか目についたのはAbdoul Macinaの博士論文(2018)、SEMANTiCS 2016でのビジネスアプリのデータ統合/同期あたり。どれも出典への参照はなく、漠然と使われている用語なのか(☞参照) (original post at )
- 2019 Knowledge Graph Conference Trip Report www.juansequeda.com/blog/?p=330 金融ほか業界が知識グラフKGを使い始めている、Airbib、Uberなども。普及の壁は技術的なものより社会的要因(組織間の責任とか共通オントロジーを誰が作るかとか)。仮想知識グラフへの関心高い。ほか複数のレポートが twitter.com/aaranged/status/112835550817... (original post at )
- We share Squerall a software for querying large and heterogeneous data lists.w3.org...semantic-web/2019May/0051... 異なるデータのスキーマをマッピングする仮想オントロジーを用いて、データ変換なしに統合的な利用を可能にするという。Apache SparkとPrestoをクエリエンジンに採用、Mavenでインストールするそうで、その辺りで残念ながら試用は断念 (original post at )
2019-05-06
- 相撲絵の場合:Web Annotation for Japan Search www.kanzaki.com/works/ld/jpsearch/annot-... アイテム記述に独自メモやタグを加える方法として、注釈表現が使えます。統合クエリ可。#ジャパンサーチ のマイノートからもWeb Annotationを生成できます(☞参照) (original post at )
2019-05-04
- 相撲絵の注釈を考えていて、Web Annotationもプロパティグラフのバリエーションの1つであるという考えに至る。単一bodyならmotivationがプロパティに対応するが、複数bodyを持てるので、その場合は各bodyのpurposeがそれぞれのプロパティを表す2階建て構造 (original post at )
- RDF 1.1 Concept §3.3 "Lexical representations of language tags may be converted to lower case. The value space of language tags is always in lower case" Virtuosoが勝手に言語タグを小文字化するのは、いちおう根拠があるということになるのか。しかしVirtuosoもARQも、検索では言語タグの大小文字を区別している :((☞参照) (original post at )