Web・出版社・メタデータ。三者を巡るDPUB IGの報告書が興味深い
W3C Digital Publishing Interest Group(DPUB IG)のMetadata Task Forceでは既存のさまざまなメタデータ標準の調査と出版社へのインタビューを元に報告書を作成し、W3Cに提言を行っている。
今回も調べたことを雑にまとめたい。報告書はこちら。
DPUB IG Metadata Task Force Report
本稿執筆時点でのバージョンは2015年01月08日時点のもの。Web・出版社・メタデータを巡る現状と問題点を俯瞰的な視点から知ることができるので、興味がある人は目を通すとよいと思う。
DPUB IGについては、以前にこの記事の中で触れた。
Metadata Task Force
DPUB IGの中に結成されたMetadata Task Forceの目的は出版社がメタデータに抱える不都合の解決をW3Cが手助けできるようにすることだ。
メタデータの利用形態
出版社は3つの異なる方法でメタデータを使っている。
- 出版物に内包されたメタデータ。例: EPUB、ウェブサイト
- 出版物から分離したメタデータ。例: 出版社がサプライチェーンに提供する定期刊行物のメタデータフィードなど
- 出版物の情報を提供するシステムに組み込まれたメタデータ。例: 出版社、書店、図書館などのウェブサイト
出版社が抱えるメタデータの「つらみ」(pain point)とは?
- 粒度 出版物レベルではなく、コンテンツに任意の粒度でメタデータを関連付ける必要がある
- 複雑さ 沢山の識別子やメタデータ語彙があり混乱する
- 難しさ 非技術者がメタデータを提供できるシステム/ツールが少ない
- 無益さ せっかく提供したメタデータがシステムの中で生かされていない
理解と実装の欠如が原因
報告書はこれらの問題を次の2つのカテゴリに分類できるとしている。
- OWPを改良することで解決されるもの。
- 理解と実装の欠如によるもの。(=OWPの既存の仕組みが出版社やサプライチェーンの中で使われていない)
調査の結果、Metadata Task Forceはほとんどの主要な問題は後者(理解と実装の欠如)に属するとした。
W3Cへの提言
これを踏まえ、Metadata Task ForceはW3Cに3つの提言を行っている。
- 新しいメタデータ語彙を導入するのではなく既存の語彙の活用に注力すること
- 出版社やそのパートナーが既存のOWPの仕組みを最大限に活用できるよう教育を行うこと
- コンテンツに権利関係のメタデータを関連付けることを促進する作業を行うこと
出版社へのインタビュー
報告書にはMetadata Task Forceが調査のために出版社に行ったメタデータに関するインタビューの結果も掲載されている。興味深いのはメタデータへの態度が各分野の出版社ごとに異なる点だ。
- 商業出版社はコンテンツの発見を重視している
- 教育出版社は資産やコンテンツの管理の側面を重視している
- 学術出版社はメタデータを「すでに解決済みの問題」と見なしている
- 雑誌や報道を扱う出版社は権利関係のメタデータに注力している
おわりに
この報告書は付録も充実しており、さまざまなメタデータ語彙やフレームワークのリストは俯瞰的視野を手に入れる上で便利だ。提言に沿うならば、これらのメタデータは今後も使われ続けることになるだろう。気になるのはEPUB-WEBとの関係だが、EPUB-WEBのメタデータは分野ごとの拡張を許容するので、これら既存のメタデータを拡張として利用するシナリオは想定しているのではないだろうか。ただし識別子については新たなURNスキームを新設するようだが、別途記事を設けて触れたい。