メタ情報とセマンティック・ウェブ
This page is the table of contents of "The Intruduction to Metadata and Semantic Web". Most parts are written in Japanese, but everybody is welcome.
ウェブは人間が読むための「文書のウェブ」から、様々なデータを自在に発見して利用できる「データのウェブ」へと向かいます。セマンティック・ウェブと呼ばれる分野では、このデータのウェブを実現するために、表現のモデルや交換・共有を可能にするオントロジー、そして推論や頼性検証といった各レベルでの技術開発が進められています。メタデータを適切に与えることで、文書情報をこの「データのウェブ」に組み込むことが可能になります。
- RDFグラフとリンクするデータ
- リソースとメタデータの表現
- 語彙とオントロジー
- メタデータの応用と提供
- そのほか
- ★最近の関連情報 (2023-03-13)
RDFグラフとリンクするデータ
- Linked Data(説明スライドから)
- 連携するデータ、リンクするデータ (2007)
- リンクするデータ、未来へのリンク (2011)
- 日本十進分類とリンクするデータ(2016)の4原則アニメーション
- RDFグラフの視覚化(各構文のRDFデータを円と矢印の図に変換)
- Linked Data Browser(大きめのRDFデータを入れ子テーブルで整理)
- ジャパンサーチ非公式サポート (ツールの使い方、エンドポイント留意点、ジャパンサーチ名鑑(正規化名索引)、MAL統合クエリ、Web Annotationとの組合せなど)
- Image annotator (Web Annotationによる画像注釈やIIIFマニフェストを利用した画像コレクション表示の試み)
Linked First Folio (ボドリアン図書館シェイクスピア・サイトのTEI/XMLデータとデジタル画像を結びつける試み)
リソースとメタデータの表現
- ごく簡単なRDFの説明 できるだけ分かりやすくコンパクトに説明したスライド資料 (2014)
語彙とオントロジー
メタデータの応用と提供
- メタデータによる知人ネットワークの表現:FOAF
(例)
- 写真/画像とメタデータ (暫定公開)
- 位置に関するメタデータとその応用
- FOAFとRSSを用いた画像メタデータ
- イベント情報の公開と活用:RDFカレンダー
- サイト情報の要約と公開:RSS
- ライセンス記述の新しい形:Creative Commonsのメタデータ
- 利用者側プロファイルの提供:CC/PPとUAProf
- プライバシーに関するメタデータ:P3P(とりあえず例)
そのほか
- セマンティック・ウェブに関連してお話ししたときのXHTMLスライド集
- ちょっとしたメモ(主に2003~2008のセマンティック・ウェブ黎明期のメモ)
- Instant Metadata - フォームによるメタデータ簡単生成
- および更に簡単ブックマークレット
- Metadata in XHTML - XSLTによるRDFの抽出
- XHTMLからメタデータを自動抽出する
- XHTMLを拡張し、メタデータを直接記述する
- 『RDF/OWL入門』と『セマンティックHTML/XHTML』
- Some experimental works
- 参加しよう(古い断片)
最近の関連情報
planet masakaからセマンティック・ウェブ関連の最新メモ20件を取り出しています。過去の関連メモはRDF on Planet masakaを参照。
2023-03-13
- ジャパンサーチの神戸大学附属図書館DA新聞記事文庫をRDF化しSPARQLエンドポイントで公開しました。1911~1945年の記事327,621件を、年度別、媒体別、切抜帳(主題)別などに集約できます。jpsearch.go.jp/rdf/sparql/easy/?query=SE... 各記事には画像に加えIIIFマニフェストも提供されます(☞参照) (original post at )
2023-02-19
- Using "Punning" to Answer httpRange-14 www.jenitennison.com/2012/05/11/using-pu... OWL2 fullのパンニング(クラス/プロパティのIRIを個体の識別にも使う)で情報リソースと非情報リソース両方をカバーするアプローチもあるはず―と探して出てきた、2012年のJeniTの記事。プロパティ定義でその主語/目的語が何を期待するか明示しておくことで、URIがどっちなのか判断するというもの。あり得る解だと思うのだが、アプリケーション側の負荷が重すぎるためか同様の意見はほとんど見かけない(綴りをpanningと勘違いしていろいろ手間取った…) (original post at )
2023-01-26
- Web Data Commons - October 2022 webdatacommons.org/structureddata/2022-1... 31.5億ページ中47%に構造化マーク付あり→865億トリプルRDF(前比5%増)。URLでも埋込JSON-LDがMicrodataを抜いて首位になりトリプル数ほかも差を広げている。ほか考察は前年とほぼ同じ。ML lists.w3.org...public-schemaorg/2023Jan/...(☞参照) (original post at )
2023-01-21
- Let’s talk about pods ruben.verborgh.org/blog/2022/12/30/lets-... SolidプロトコルのPOD(Personal Online Data Store)は文書単位の構造ように捉えられていて同じデータを異なるアプリケーションで用いることが難しくなっているが、グラフ構造にしてビュー定義を分離することで柔軟になる。Solidはもともとそれと親和性がある、とRubenから。それに対する反論をTimBLがDesignIssuesに書いているのだが、何故か今は消されているのでWaybackmachineの内容をWeb Annotationにしてみた。www.kanzaki.com/works/2016/pub/doc-annot...(☞参照) (original post at )
2023-01-19
- Japanese Handscrolls in the Collections of Staatsbibliothek zu Berlin themen.crossasia.org/japanese-handscroll... ベルリン国立図書館のアジア研究サイトCrossAsiaで所蔵の絵巻類を公開。IIIFのレイヤーを用いて全体をスクロールできるようにしている(よく見たらimage-annotatorが使われている!)(☞参照) (original post at )
2023-01-12
- Loading the Wikidata dataset 2022/12 into Virtuoso OS community.openlinksw.com/t/3580 昨年末のダンプ約179億トリプルを取り込んだ際のレポート。メモリ128GB、6並行ロードで13.5時間など。公開エンドポイントは wikidata.demo.openlinksw.com/sparql wdt:などの接頭辞は宣言無しで使える。ML lists.wikimedia.org/hyperkitty/list/wiki...(☞参照) (original post at )
2022-12-31
- OntoLex-FrAC:Frequency, Attestation and Corpus Information www.w3.org/community/ontolex/wiki/Freque... 自然言語処理のコーパスや注釈を記述・公開するOntoLexのモジュールとしてOntology-Lexica CGで検討されているRDF語彙。10月のML:Semantics and Embedding Vectorsから lists.w3.org...semantic-web/2022Oct/0035... (original post at )
- Wikidata: Sitelinks to redirects www.wikidata.org/wiki/Wikidata:Sitelinks... 用語が別のWikipediaページの一部となっていてリダイレクトされる場合(例:Cicerostraßeが「ベルリン・ハレンゼーの通りと広場」にリダイレクトされる)、その元の用語自身をWikidataからのリンク先とするためにバッヂを添える方法。これがあればWikipediaでは部分概念でも独立したWDのIDが使える。9月のMLでテスト稼働が報告されていたがすでに導入されている模様 (original post at )
- GRDDL for BigData or CSVW for Avro? lists.w3.org...semantic-web/2022Jun/0003... ビッグデータをApache Hadoopで交換するフォーマットAvroのスキーマ(AVSC)をRDF/LDに変換する手段あるいはツールについて。6月。Semantic Annotations for Linked Avro Data (SALAD)というのも github.com/common-workflow-language/sche... (original post at )
- Re: RDF lists/arrays and n-ary relations lists.w3.org...semantic-web/2022Oct/0005... リストの議論の延長としてそれはN項関係で記述できるという話から、RDFを実用的に(プログラミング言語で)使うための糖衣構文(例えばリスト/Bagのアイテムが配列なら要素番号、JSONオブジェクト型ならキーを親プロパティのサブプロパティとして扱うとかデータ型とか)やらそもそものRDF意味論やら。PFPSによる今のRDFで構造化値を扱う方法のまとめを取り敢えず話の収束点として(☞参照) (original post at )
2022-12-30
- Re: OWL and RDF lists lists.w3.org...semantic-web/2022Sep/0010... FHIRのRDF表現においてOWL推論を活用しようとするとRDFリストが使えない制約があり独自の回避方法を用いなければならないが、リストを含むrdf語彙をOWL推論(ABox)でも可能にできないかといった議論から様々なリスト表現構文のアイデアやPatHayesの意味論的反論、複数値のデータ型そしてRDFにおけるJSON配列的なリストがほしいなど長く複雑なスレッド。8月から (original post at )
- Re: Is a trailing slash 'better' than a trailing hash for vocabs namespace IRIs? lists.w3.org...semantic-web/2022Oct/0027... URIを辿ると自動的に語彙全体の定義が返ってくるハッシュ型URIより選択的にコントロールできるスラッシュ型がBPと言えるのでは→必ずしもそうではなくそれぞれ利点がある→各ポイントはやはりスラッシュ型の利点では、といったやり取りの長いスレッド。関連してisDefinedByの話も派生。10月 (original post at )
- Images and the promise of ARKs with IIIF arks.org/blog/images-and-the-promise-of-... IIIFのURIにARK(Archival Resource Key)を組み込むことの可能性と具体的方法についての考察 (original post at )
- Towards N-ary Predicate Calculus in TriG lists.w3.org...semantic-web/2022Dec/0008... 多項述語論理をTriGで記述するというアイデア (original post at )
- Syntactic Options for Probabilistic Semantics lists.w3.org...semantic-web/2022Nov/0038... 確率意味論をN3構文のRDFとして記述する方法についてのアイデア。スレッドに出てくるNotation3 EditorではN3の推論を実行してみることができる (original post at )
2022-12-29
- Wikidata Atlas wdatlas.dcc.uchile.cl 特定タイプのインスタンスを検索して地図表示してくれるサービス。たとえばBuddhist temple (Q5393308)は大多数が日本だがパリなどにもあることが分かって面白い。他の同様サービスも含めML lists.wikimedia.org/hyperkitty/list/wiki... (original post at )
- The Japan Search SPARQL endpoint has reached 1.2 billion RDF triples -- 24.6 million items of Japanese digital resources aggregated from 174 datasets, including MLA, humanities, scientific specimens, and more. jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
- ジャパンサーチの地質標本データベース(産総研)をRDF化しSPARQLエンドポイントで公開しました。jpsearch.go.jp/rdf/sparql/easy/?query=SE... 2022年末でのRDF化データは174データセット、約2456万アイテム、12億トリプルとなりました(☞参照) (original post at )
2022-12-28
- Re: uri for uri lists.w3.org...public-lod/2022Dec/0006.h... URIをスキーム、ホストなど構成要素に分解してRDFで表現してくれるという懐かしの試みが w3id.org/uri4uri として恒久化して蘇ったと。シリアライズにJSON-LDも選べる(☞参照) (original post at )
2022-12-23
- Re: The future of the W3C? lists.w3.org...semantic-web/2022Dec/0069... W3CがMITとの契約更新で手間取っている話が発端→danbriからW3Cの「会員」重視により初期セマンティック・ウェブが窮地に追い込まれ、より広い参加によってそれを打破してきた25年についての怒りを込めた長いメッセージ (original post at )