6. 本デジタルアーカイブが提供するデータについて

6.1. 目録で使用している文字について

国立公文書館デジタルアーカイブでは、文字コードの標準規格であるUnicode(UTF-8)を使用しています。

提供する目録の表記において、目録作成時点で特定の文字集合になくいわゆる外字としたもの、Unicode(UTF-8)にない文字について、ゲタ字「〓」で入力されているものがあります。

また、原本の破損又は汚損等による判読不能部分については「□」を、利用制限情報に該当する可能性のある部分については「■」を入力しています。

但し、当館の目録の作成にあたって、特定歴史公文書等(所蔵資料)に記載された表記(電子公文書等については、政府全体の文書管理システムから抽出された情報)を採録した場合、これらの記号が使用されている場合があります。

※参考:「特定歴史公文書等の目録に関する基本的な考え方(令和2年2月17日館長決定)

6.2. メタデータの種類と形式について

国立公文書館デジタルアーカイブでは、RDF(Resource Description Framework)の規格に基づいて、以下のメタデータの一部の項目をRDFデータとして格納し、RDF(XML)、Turtle、JSONの3つの形式により提供しています。

(1)目録データ(資料群)

(2)目録データ(簿冊)

(3)目録データ(件名・細目)

6.3. メタデータの取得方法について

目録データ(資料群)、目録データ(簿冊)、目録データ(件名・細目)のRDFデータは、以下のURL(各画面の下に表示されるURIの末尾に「.rdf」「.ttl」「.json」と付与)にアクセスすることでダウンロードできます。

(1) 目録データ(資料群)

  • ・[RDF形式]https://www.digital.archives.go.jp/fonds/[ID].rdf
  • ・[Turtle形式]https://www.digital.archives.go.jp/fonds/[ID].ttl
  • ・[JSON形式]https://www.digital.archives.go.jp/fonds/[ID].json

(2) 目録データ(簿冊)

  • ・[RDF形式]https://www.digital.archives.go.jp/file/[ID].rdf
  • ・[Turtle形式]https://www.digital.archives.go.jp/file/[ID].ttl
  • ・[JSON形式]https://www.digital.archives.go.jp/file/[ID].json

(3) 目録データ(件名・細目)

  • ・[RDF形式]https://www.digital.archives.go.jp/item/[ID].rdf
  • ・[Turtle形式]https://www.digital.archives.go.jp/item/[ID].ttl
  • ・[JSON形式]https://www.digital.archives.go.jp/item/[ID].json

※ IDとは、各目録データに一意に付与された識別子です。目録詳細画面の下に表示されるURIの最後の数値がIDです。なお、URIは、ブラウザのアドレスバーのURLも同じものを表示しています(下図は簿冊詳細画面の例です)。URIについては、「7. 用語について」を参照してください。

目録詳細画面のURI表示 目録詳細画面にURIが表示されることが確認できる。
ブラウザのアドレスバーのURI表示 ブラウザのアドレスバーにURIが表示されることが確認できる。

6.4. SPARQLによる検索について

SPARQLエンドポイントへアクセスすることで、RDFデータを検索し、その結果を取得することができます。

SPARQLによる検索での取得上限は30,000トリプルとなります。

SPARQLエンドポイントのURLは下記のとおりです。

https://www.digital.archives.go.jp/sparql?query=[SPARQLクエリ]

【 SPARQLクエリーの例 】

select * where {<http://www.digital.archives.go.jp/file/1068430>?p?o} limit 10

RDF、SPARQL、SPARQLエンドポイントについては、「7. 用語について」を参照してください。

6.5. RDFデータの構造について

当システムで格納しているRDFデータの構造について説明します。RDFデータの種類により出力される項目は異なります。

名前空間の定義は以下のとおりです。

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"

xmlns:dct="http://purl.org/dc/terms/"

xmlns:prov="http://www.w3.org/ns/prov#"

xmlns:ead="http://www.digital.archives.go.jp/voc/ead/"

xmlns:foaf="http://xmlns.com/foaf/0.1/"

xmlns:owl="http://www.w3.org/2002/07/owl#"

※RDFについては、「7. 用語について」を参照してください。

【目録データ(資料群)】

タイトルrdf:Description/dct:title
作成者情報rdf:Description/foaf:name
目録データ種別rdf:Description/ead:materialspec
rdf:Description/rdf:value
資料種別rdf:Description/ead:materialspec
rdf:Description/rdf:value
階層情報rdf:Description/ead:materialspec
rdf:Description/rdf:value
資料内容rdf:Description/dct:abstract
階層情報(親資料URI)rdf:Description/dct:isPartOf
rdf:resource=“http://www.digital.archives.go.jp/fonds/[ID]"

【目録データ(簿冊、件名・細目)】

レファレンスコードrdf:Description/dct:identifier
タイトルrdf:Description/dct:title
作成年月日(FROM)rdf:Description/prov:startedAtTime
作成年月日(TO)rdf:Description/prov:endedAtTime
作成者情報rdf:Description/foaf:name
言語rdf:Description/dct:language
保存場所(館)rdf:physloc/ead:physloc
目録データ種別

rdf:Description/ead:materialspec

rdf:Description/rdf:value

資料種別

rdf:Description/ead:materialspec

rdf:Description/rdf:value

階層情報

rdf:Description/ead:materialspec

rdf:Description/rdf:value

媒体の種別

rdf:Description/dct:source

rdf:Description/dct:medium

資料内容rdf:Description/dct:abstract
階層情報(親資料URI)

rdf:Description/dct:isPartOf

簿冊の場合

rdf:resource=“http://www.digital.archives.go.jp/fonds/[ID]"

件名・細目の場合

rdf:resource=“http://www.digital.archives.go.jp/file/[ID]"

利用制限の区分rdf:Description/ead:accessrestrict
コンテンツ種別rdf:Description/dct:subject
コンテンツURLrdf:Description/owl:sameAs
コンテンツURL(IIIFマニフェストファイル)rdf:Description/rdfs:seeAlso
サムネイル画像rdf:Description/foaf:thumbnail
コンテンツの公開状況rdf:Description/ead:userestrict
コンテンツの権利区分(ライセンス)rdf:Description/dct:license

6.6. IIIFについて

本デジタルアーカイブが対応している、IIIFに対応した画像ビューアとして以下があります。IIIFマニフェストURIをIIIFビューアで指定することによって、本デジタルアーカイブの画像をIIIFビューア上で利用することができます。詳しくは、「4. コンテンツの閲覧、ダウンロード、印刷について」を参照してください。