2022 年 32 巻 1 号 p. 15-38
現在,日本国内の各機関における漢籍のデジタル化においては,いくつかの課題が指摘されてきた.例えば,各機関ごとに様々な独自フォーマットで提供されていることによって,メタデータを機関横断して連携しにくくなっている点,また,本文フルテキストにおける要素,特に訓点やルビなどをデジタル化するとき,それらを共通化された方法で扱えず,デジタル表現として計算機が扱うことが難しい点が指摘されている.そのため,本研究では,日本における漢詩作品のデジタル化に注目する.漢詩作品を研究対象として,漢詩の構造化に関する研究を行う.研究データとしては,教科書に掲載された唐詩作品を用いた.具体的には,漢詩作品に関わる情報を抽出し,新たな Linked Open Data (LOD) データモデルを構築し,そのデータセットをウェブ上で公開した.また,漢詩作品の本文フルテキストにおける訓点情報とルビ情報を表現する方法を検討し,TEIマークアップ手法を用いて,漢詩情報のウェブ上でのデジタル化表現を提案した.最後に,これらの構造化の結果に韮づいて,二つの漢詩作品の同士の間の差異を提示した利活用を試みた.