Japanese Journal of Digital Humanities
Online ISSN : 2189-7867
articles
An Encoding Model for Earlier Japanese Lexicography: The TEI-Based Encoding of Heian-Era Dictionaries
Kazuhiro Okada
Author information
JOURNAL OPEN ACCESS FULL-TEXT HTML

2020 Volume 2 Pages 26-

Details
Abstract

TEIをもとにした日本古辞書の効率的な符号化モデルについて論ずる。日本の古辞書(1615年以前の日本編纂辞書)、具体的には平安時代の漢字字書を本稿では例とする。古辞書はしばしば構造を見いだしがたく資料として利用しにくい。そのような懸隔を構造注記によって補いたい。また、これらの資料を共通のモデルで符号化することで、資料間の構造差が見いだしやすくなることが期待される。ここで用いるスキーマは、TEI(Text Encoding Initiative)で、国際的に用いられている本文符号化の取り決めである。さまざまな符号化の考え方を包摂し、そのなかには辞書や語彙データベースに関するものもある。TEIは現状東アジアの古典的辞書への適用が十分に検討されているわけではないので、符号化に際しては考慮すべきことが多い。本稿では、古辞書に見られるさまざまな要素をどのように符号化することが情報交換において望ましいか論ずる。

Translated Abstract

This paper describes an efficient encoding model using a TEI-based schema for the earlier Japanese dictionaries (–1615), namely Heian-era Chinese character dictionaries. Structural annotation allow us to mediate the structural invisibility in earlier dictionaries that hinders the wider use of those materials. Moreover, encoding these materials in a uniform model will clarify their structural differences. The schema, TEI (Text Encoding Initiative), is a globally accepted text-encoding convention that encompasses a variety of encoding ideas, including those for dictionaries and lexical databases. There has been little literature on the application of TEI to traditional East Asian dictionaries, whose encoding raises a number of considerations. This paper establishes a method of efficient encoding of the characteristic elements of earlier dictionaries.

1. はじめに

日本における古辞書は、慶長年間以前(–1615)の辞書を言い、現存最古の篆隷万象名義(9世紀)をはじめとして長い伝統を有する。それは中国編纂の字書などに強い影響を受け、現代の辞書とはかなり異なった構成を取る。その符号化について、個別辞書的な試みを超えた統一的モデルは議論されておらず、研究者がそれぞれ自身の研究目的にあわせて独自の符号化あるいはデータ化を行なっているところである。それ自体は是非を問われるものではないが、符号化の妥当な統一的モデルがあればより効率的な符号化や情報交換の一助となるはずである。

本稿では、そのような目的のもと、TEI(Text Encoding Initiative)の符号化モデルに基づく日本の古辞書の統一的符号化モデルを提示する。TEIは1987年からはじまった人文学テクストのよりよい符号化のありかた(モデル)を模索する試みである。多種多様なテクストと符号化の目的とに対応すべく、TEIでは唯一絶対の符号化モデルの存在を前提とはせず、時に応じてTEIそのものの拡張をも許す作りとなっている。近時は見た目の忠実な反映(エディシヨン・ディプロマティーク)やそこから派生してテクストの生成の符号化にも取り組まれるようになり、テクストのさまざまな問題に取り組むことを容易にするものとなっている。辞書の符号化についてはTEIの形成当初から取り組まれており、TEIの重要な一部をなすが、そのモデルについては漢字字書にかならずしも適用しやすいものではない。そのため、本稿のモデルは、日本の古辞書の典型的な要素を効率よく符号化する基盤とすることを重視するものである。このことによる正の効果として、辞書間の比較や統一的な処理が容易になることが期待できる。

本稿では、まず日本の古辞書について概観したのち、TEIとくに辞書に特化した符号化モデルを提供する辞書モジュールについて解説を加え、若干の問題点を論じ、それを補う変更点について述べる。そのつぎに日本の古辞書の符号化モデルを論点ごとに示す。最後に『篆隷万象名義』および図書寮本『類聚名義抄』について符号化を試み、参考に『色葉字類抄』および『康煕字典』の符号化を行って本モデルの応用可能性について見る。

2. 日本の古辞書について

日本の古辞書、とくに平安期のそれは、中国の辞書史の伝統を汲み発展したものである 1。池田は、日本の古辞書に対して、いわゆる字書である『説文解字』や『玉篇』、『切韻』(韻書)などのほかに、仏典中の難語を釈義したものである仏典音義の影響が大であることを説く。その影響は、典拠として直接漢土の字書を引用することにとくにあらわである。たとえば、図書寮本『類聚名義抄』(1100年ごろ)の「詳」を見ると、つぎのようにある:

詳 宋云本音祥・慈云安者徐也、―[詳]者審也。或以章反―[詳]狂也。今從初・中云探玄記云―[安]―[詳]審諦之状。捷作。養也。之言詳也亦通・弘云審也論也議也也詐也。・又音与羊同 アキラカ  イツハル  ツハヒラカニ  眞云シヤウ 2

ここでは、「詳」の文字がつづく注文(注釈文)の2行分の大きさを持つ掲出字として現れ、その後に中国の字書である「宋」(宋本『大広益会玉篇』)や中国僧で法相宗を開いた「慈」(慈恩大師)の著作などにかくあるとし、その後にやはり出典の注記とともに和訓を提示する。このような掲出形式は、引書を明示しなくなって漢字字書としての色を強めた改変本系『類聚名義抄』(12世紀)においても、根本的に差異はない。

このような古辞書の構造について、李は、掲出字と注文とに二分され、注文はさらに反切・義注・字体注に細分されるものと把握する 3。按ずるに、このような漢字字書は、基本的には、同綴(異音)異義語homographを見出しとする辞書であり、その弁義は音注によって行われるのである。つぎに掲げる「便」字は、そのような同綴異義語のひとつであるが、中国の『康煕字典』においてはつぎのようになっている:

便【廣韻】婢面切【集韻】【韻會】【正韻】毗面切,音卞。順也,利也,宜也。[…]又【集韻】毗連切【正韻】蒲眠切,音駢。【爾雅·釋訓】便便,辨也。

日本の辞書に多大な影響を与えた宋代中国の『玉篇』においても、類例がある:

塞 蘇代切。《說文》云:隔也。又蘇得切。實也、滿也、蔽也。 4

すこし体裁は異なるが、それは現代の漢字字書においても当てはまる。Fig. 1の『漢字海』(第4版)の例では、現代の字書においても、字音が掲出字の下部に集められて現代辞書的な見出しの一部となっているのと同時に、多音字については、語義が字音によって分けられて説明されていることも分る。

Fig. 1. 『漢字海』第4版(物書堂版)における多音字(「教」)

Fig. 1. An example of polyphonic character inKanjikai 4th ed. (“教 jiào”)

このような掲出字と注文という古辞書の構成は、国語辞書につながる『色葉字類抄』(1177–81ごろ)などにおいても大きく変わるわけではない。漢字をいろは順に整理し同一の字訓を持つ漢字をひと並びにする部を有する本書において、「ユルス」という字訓を有する漢字を検ずるに、

許〈ユルス/虚呂反〉免〈亡弁反〉赦(シヤ) 聴〈―昇殿/他定反〉祚原〈恕也〉[...]税〈已上同〉 5

となっていて、日本語としての語形や意味を重視する現代の国語辞書などとは異なり、漢字に優先的な地位が用意されていることがあきらかである。このため、古辞書であれば、漢字字書にかぎらず、統一的なモデルで処理が可能である。

3. TEIについて

TEIは、TEIコンソーシアムを中心にコミュニティによって取りまとめられているXMLに基づくテキスト符号化のガイドラインである。その詳細はイデ・スパーバーグ=マックイーン・バーナードを参照 6

3.1 TEIの辞書モジュールについて

TEIは、どのようなばあいも用いる中核coreモジュールのほか、目的ごとに要素やデータモデルをモジュール化している。そのひとつが辞書モジュールであり、紙媒体における辞書のマークアップだけでなく、語彙資源の符号化に対応して、言語処理プログラムの用に供する汎用性を持つ。したがって、紙媒体の辞書をこのモジュールにしたがって符号化する際には、紙媒体上で用いられていた記号が不要とされることも多い。

3.2 辞書モジュールの前提とする構造と漢字字書の構造との相違

TEIの辞書モジュールは、西洋の近代的な辞書の構造をその前提としている。したがって、さきに述べたごとき漢字字書の構造とは相容れないことがある。TEIのガイドラインにおいて、例に挙げられた辞書項目はつぎのようである:

com.peti.tor /k@m"petit@(r)/ n person who competes.


          <entry> 
            <form> 
              <orth>competitor</orth> 
              <hyph>com|peti|tor</hyph> 
              <pron>k@m"petit@(r)</pron> 
            </form> 
            <gramGrp> 
              <pos>n</pos> 
            </gramGrp> 
            <def>person who competes.</def> 
          </entry>7
          

ここで<entry>は構造化された項目であることを意味する。構造化されているとは、具体的には、構成要素が語形(表記・分綴・発音)・文法的情報・語義などごとに木構造をなすことを云う。したがって、つぎのような辞書項目は語形の要素とされるものが定義に含まれているために構造的とはされず、非構造化項目のための<entryFree>によって符号化されなければならない:

demi・god /ˈdemɪɡɒd/ n

1 one who is partly divine and partly human 2 (in Gk myth, etc) the son of a god and a mortal woman, eg Hercules /ˈhɜːkjʊliːz/


          <entryFree> 
            <form> 
              <orth>demigod</orth> 
              <hyph>demi|god</hyph> 
              <pron>"demIgQd</pron> 
            </form> 
            <gramGrp> 
              <pos>n</pos> 
            </gramGrp> 
            <def>one who is partly divine and partly human</def> 
            <def>(in Gk myth, etc) the son of a god and a mortal woman, eg 
              <mentioned>Hercules</mentioned> 
            </def> 
            <pron>"h3:kjUli:z</pron> 
          </entryFree>8
          

このような前提にたってみれば、漢字字書の構造においては発音の位置が辞書モジュールの前提とする語形の構造にないために、原理的に<entry>要素によって符号化が行えないことになる。しかしながら、上記のような構造がない例と異なり、漢字字書は掲出字(表記)と発音とが分かれる構造なのであり、真に構造のない例(図書寮本『類聚名義抄』など)と区別できるほうが好ましい符号化に繫がるものと考えられる。

3.3 本モデルでの符号化について

さきに多音字において、字義が掲出字の持つ字音に対して説明されることを示した。本モデルでは、そのような字音と字義の関係を多音字以外にも拡張することで日本の古辞書へのTEI適用にまつわる問題の解決を図りたい。すなわち、字音ごとに<hom>(同綴異義語)要素を設けることで構造の記述を行うというものである。さきほどの宋本『玉篇』によって示せば、つぎのごとくになる:


          <entry> 
            <form><orth>塞</orth></form> 
            <hom> 
              <form><pron>蘇代切。</pron></form> 
              <cit> 
                <bibl>《<name>說文</name>》云:</bibl> 
                <sense><def>隔也。</def></sense> 
              </cit> 
            </hom> 
            <hom> 
              <form><pron @type="fanqie">又蘇得切。</pron></form> 
              <sense><def>實也、滿也、蔽也。</def></sense> 
            </hom> 
          </entry>
          

<hom>要素は<entry>と異なり、その下に<hom>要素を持てないので、これより複雑な例は構造化することができない。たとえば、昌住編の『新撰字鏡』(898–901ごろ)における「便」がそれである:

便 正音:父賤反。平:習也,安也,利也,蕃彩也。借音:父面反。去:方便也,取也,寧也。 9

これは、正音として反切によって字音が示され、さらに四声によって字義、くわえて仮借の字義が示される。したがって、構造をあえて求めるのであれば、共通の反切の下にさらに四声などによって構造化することとなるが、これは現状のモデルでは表現しきれない。しかしながら、この例は、上に挙げた構造のないものの類例と考えるほうがモデルを複雑化させすぎないで済むし、また、それで十分符号化は行えるものと思われる。

4. 日本古辞書の符号化モデル

4.1 先行研究

日本古辞書を符号化した例としては、申 10、劉ほか 11、藤本・韓・高田 12、李 13、申 14などがある。劉ほか、藤本・韓・高田は単体の独自符号化であり、符号化すべき内容の検討を参照するに留める。

李は『篆隷万象名義』の符号化をTEI P5を用いて試みた例である。TEIとして妥当でない構文が散見されるが、対象の辞書を専門とする研究者の符号化例であり、TEI辞書モジュールの構造化と『万象名義』の構造の比較など参考になる点が多い。

申「構造化テキストの設計と実践」は、申「本文解読とデータベース作成」の改訂版であり、図書寮本『類聚名義抄』の符号化の検討例である。やはりTEIとして妥当とはかならずしも言いかねるものの、符号化の考え方は参考になる。ただし、劉ほかが申「本文解読とデータベース作成」についてに留保するように 15、未解読部分の多い資料の符号化には最初から符号化を完備させることは現実的ではない。また、『類聚名義抄』専用の符号化モデルの理解は、『類聚名義抄』の理解と同程度に困難であり、符号化されたデータの流通の面で問題がある(これは李にも言えることである)。

このような本文の定まらない古辞書の性質は、TEI Lex-0プロジェクト 16のように、語彙情報の符号化だけに特化させることを阻む。したがって、本モデルは、TEIとして妥当であり、かつ、特定の辞書の構造に近づきすぎないことを目指して設計する。これは、辞書間の比較や統一的な処理を容易とする効果を得るためである。例は、基本的に5節を参照のこと。TEIのガイドラインの範囲を超えない要素や属性の用法については記述しない。

4.2 符号化の段階

辞書の符号化は、そもそも考慮すべき点が多いうえ、研究の進展にともなって構造の把握が変わり得ることを考えれば、最初から構造化を目指すべきではないし、そもそも詳細な構造を見いだせないものもあろう。したがって、符号化には下記のような段階が考えられる:

  •    第1段階:分章を行い、<entryFree>によって項目の分割を適切に行う
  •    第2段階:項目を分析して適切な構造化を行う
  •    第3段階:注の構造化を行う

4.3 ヘッダー

ヘッダーには、原資料や符号化に関する情報を記載する。下記の点をのぞいて本モデルに固有のことがらはない。

4.3.1 凡例の記載

古辞書によっては、引用の出典の記載がされるものがある。符号化の進展した段階で、そのような出典について整理の必要性が生まれることが考えられる。また、出典が書物であるとはかぎらないため、便宜的に<notesStmt>要素にそれを整理することは優に考えられることである。<notesStmt>は<fileDesc>要素内の<sourceDesc>要素の前に配置しなければならないことに注意。


              <notesStmt> 
                <note xml:id="宋">『大広益会玉篇』。いま中華書局本による。</note> 
              </notesStmt> 
              […] 
              <entry> 
                <form> 
                  <orth>詳</orth> 
                </form> 
                <cit> 
                  <bibl><name corresp="#宋">宋</name>云</bibl> 
                  <pron>本音祥</pron> 
                </cit> 
                <pc>・</pc> 
                <cit>慈云安者徐也、</cit> 
              </entry>
            

4.4 前置き・後置き

辞書項目を構成しない内容はすべて<front>(前置き)要素ないし<back>(後置き)要素に記載する。序などが相当する。

とくに、分冊は空要素の<milestone>要素の@unitを"fascicle"とすることによって行う 17。@nによって、適宜附番する。

4.5 本文構造:分巻・分部

分巻・分部は、<div>の@typeをそれぞれ"volume", "part"として示す。部が細分化されているばあいは、明白な木構造であればさらに"subpart"などを設けてもよいし、つぎに示すような<label>を用いることも考えられる。複層的であるばあいは、@typeを"subpart"としたうえで@nの附番で工夫する。

分巻・分部などの見出しは<head>で符号化できる。随意的な見出しであれば、<label>を用いる。欄外であれば、@placeで位置を示す。

4.6 本文構造:項目

4.6.1 項目の符号化

<entry>ないし<entryFree>によって符号化する。

<entry>によって符号化するときは、すべての内容が定められた要素に収められていなければならない 18。<entryFree>は全体としてそのような構造を持たないことを示唆するが、あきらかに構造をなす部分は<form>、<sense>などによって構造を符号化できる。

4.6.2 子項目の符号化

検討の結果、親子として掲出されていると判断されるばあいは、それらをまとめる<entry>を設け、@typeを"wordFamily"とする。このとき、親項目の<orth>に適切なIDを附与することによって、子項目から<oRef>要素によって参照することが可能となる。

4.6.3 連続項目の符号化

検討の結果、連続して掲出される注文に共通性のある項目として掲出されているばあいは、一連の項目を<entry>によってまとめ、副項目を<re>要素によって示す(『色葉字類抄』の例を参照)。

4.6.4 組み込まれた・欠損した・欄外にある項目

組み込まれた、ないし欠損した本文が単一の項目をなすと考えられるばあいは、<entry(Free)>内に<dictScrap>要素を設け、判読できるかぎりにおいて記録する。<dictScrap>における注文の符号化は、構造化されない要素であれば、<entryFree>と同等に可能である。

欄外にある項目は、丁の最後で<floatingText>内の<entry(Free)>要素によって記載し、@prev、@nextによって見た目上ないし意味上の前後の項目に繫ぐ。<entry>、<entryFree>のどちらを選ぶかは、他の項目との一貫性によって判断する。<note>要素を<entry(Free)>内に置いて位置関係の詳細の説明を加えることができる。その際は、@respによって責任を明示し、ヘッダー内の<respStmt>要素に担当者についての説明を与える。

4.7 本文構造:掲出字

4.7.1 単字項目

<form>要素内に<orth>要素を設け、記述する。

4.7.2 複字項目:熟字のばあい

<form>要素内に単一の<orth>要素を設ける。もし、熟字を構成する一字が項目中で参照されるばあいは、<orth>要素内に<seg>要素を設けて、一字一字分割したIDを附与する。

4.7.3 複字項目:重出のばあい

<form>要素内での<orth>要素をそれぞれ分ける。重出の意図に沿って、副次的な項目に@typeを与える。異体字のときは"variant"などとする。ほかの点にも言えることであるが、必要に応じて@subtypeを用いることが考えられる。

4.8 本文構造:注文

4.8.1 注文の符号化

字音によって構造化されている注文を字音ごとに<hom>によって符号化する。うえに述べたように、単一の字音注によって構造化できないものは、構造化されていない例と考える。

4.8.2 引用

内容が引用によって説明されるばあいは、箇々の引用全体を<cit>によって符号化し、出典(および云字などの引用にかかわる要素)を<bibl>と<name>によって構造化し、内容を<quote>で符号化する。引用の内部で字音や語釈が示されるばあいは、<quote>ではなく、直接適切な要素によって符号化する。

用例が示されるときは、全体を<cit>によって符号化し(@typeは"example"などとする)、箇々の用例は<quote>によって符号化する。

4.8.3 字音

<form>要素内の<pron>要素によって符号化する。表示方法によって@typeを変えることができ、反切のばあいは"fanqie"、類音注のばあいは"similar"、和音注のばあいは"SJ"などとする。

4.8.4 語釈

個別の字義を<sense>要素によって符号化し、語義の説明を<def>、それ以外のものは<note>によって符号化する。複数挙げられる字義が、多義を意味するとの確証を得られないかぎりにおいて、全体を単一の<sense>によって符号化してもよい。

4.8.5 異体字

<form>要素内の@typeを"variant"とした<orth>要素によって符号化する。字音注と距離があり、区別したいときは、それぞれ<form>の@typeを"pron"、"orth"などとする。異体字についての説明は<note>によって符号化する。

4.8.6 和訓

@typeを"japanese"とした<cit>要素によって符号化する。語形単体は<quote>要素に含め、必要に応じて出典を<bibl>要素によって示す。

4.9 本文要素:書き入れ

書き入れの対象を<seg>によって符号化し、@correspによって対応させた<add>、<del>など関連の要素によって符号化する。@placeによって、対象との位置関係を明示しなければならない。加点であれば"over"、傍書されるものは"surroundings"や"right", "left"、行間は"interlinear"、欄外は"marginalia"などが考えられる。

声点については、<add>を用いず、箇々の点を<metamark>で符号化する。声点のばあいは空要素として、@anaによって"H" (High), "L" (Low)などとして示す。その他のヲコト点や訓点返点記号は<add>内の<metamark>の内容であらわす。その際は、なるべくUnicodeの漢文用記号を用いて表現する。@functionによって役割を明示してもよい。

朱筆などの墨筆以外のものは、@rendで"vermilion"などとして明記できる。また、他筆を@handsで示すこともできるが、とくに本モデル特有の規定は設けない。

4.10 本文要素:校訂

<app>要素ないし<choice>要素によって符号化する。

4.11 本文要素:割書きおよび改行の保存

割書きおよび改行は、それじたい本文要素ではないことがほとんどであるため、原則として符号化はしないが、本文に問題があるなどの理由から、それを符号化して保存したいことは考え得ることである。

本行の改行は<lb>要素によって示すことができる。もし、<lb>を用いるならば、すくなくとも問題となる箇所のみでなく、前後にも用いるべきである。割書きは、本文行そのものとは異なる配置を持つものであり、全体を<cit>でくくり、@typeを"notes"として識別する。本文行としての改行が割書きのなかにあるものは、<lb>を用いればよく、割書きとしての改行を示す際は、@unitを"notes"などとした<milestone>によって明瞭に区別できるようにする。行数を示したいときは、@rendを"two-lined"などとする。

5. 符号化の例

以下に第3段階まで解析した符号化の例を示す。第1段階および第2段階の符号化についてあらためてかんたんに触れると、第1段階は構造化されていない翻字に対して項目ごとに<entryFree>によって項目を分割する段階であり、第2段階は掲出字や字音や語釈などを構造化してゆく段階である。

5.1 『篆隷万象名義』

『篆隷万象名義』は、空海が中国の字書『玉篇』を抄して作成された字書である。高山寺に唯一の古写本が残る。HDIC版の理解に基づきつつ第一帖の本文一丁前半の一部を符号化した。


            <?xml version="1.0" encoding="UTF-8"?> 
            <TEI xmlns="http://www.tei-c.org/ns/1.0"> 
              <teiHeader> 
                <fileDesc> 
                  <titleStmt> 
                    <title>篆隷万象名義</title> 
                    <editor>東大寺沙門大僧都空海撰</editor> 
                  </titleStmt> 
                  <publicationStmt> 
                    <p>[Omit]</p> 
                  </publicationStmt> 
                  <sourceDesc> 
                    <bibl> 
                      『<title level="a">弘法大師空海全集</title>』<vol>巻7</vol>、<publisher>筑摩書房</publisher>、<date>1984</date></bibl> 
                  </sourceDesc> 
                </fileDesc> 
              </teiHeader> 
              <text> 
                <body> 
                  <div type="volume" n="1"> 
                    <milestone unit="fascicle" n="1"/> 
                    <head>篆隷万象名義巻第一</head> 
                    <byline>東大寺沙門大僧都<docAuthor>空海</docAuthor>撰</byline> 
                    <div type="toc"> 
                    <list> 
                      <item>一部第一</item> 
                      <item>上部第二</item> 
                      <item>示部第三</item> 
                    </list> 
                  </div> 
                  <div type="part" n="1"> 
                    <head>一部第一凡八字</head> 
                    <entry> 
                      <form xml:id="T1_016_A51"><orth>一</orth></form> 
                      <hom> 
                        <form><pron type="fanqie">於逸反。</pron></form> 
                        <sense><def>少也、初也、同也。</def></sense> 
                      </hom> 
                      <dictScrap><form type="variant"><orth>弌</orth></form><note>古文。</note></dictScrap> 
                    </entry> 
                    <entry xml:id="T1_016_A53"> 
                      <form><orth>天</orth></form> 
                      <hom> 
                        <form><pron type="fanqie"><choice> 
                          <sic>秦</sic> 
                          <corr>泰</corr> 
                        </choice>堅反。</pron></form> 
                        <sense><def>顛也、顯也、君也。</def></sense> 
                      </hom> 
                      <dictScrap><form type="variant"><orth>𠀡</orth></form><note>古文。</note></dictScrap> 
                      <dictScrap><form type="variant"><orth>𠀘</orth></form><note>古文。</note></dictScrap> 
                    </entry> 
                  </div> 
                </div> 
              </body> 
            </text> 
          </TEI>
            

5.2 図書寮本『類聚名義抄』

図書寮本『類聚名義抄』は、法相宗系の僧侶が諸書をまとめて作成した辞典であり、字典である。原撰本とおぼしき一帖が宮内庁書陵部図書寮文庫に伝わる。ここでは、冒頭および補入の例を持つ「ー猒」からはじまる半丁の符号化を行う。本文校訂については、申「図書寮本類聚名義抄の基礎的研究」に従う。


          <?xml version="1.0" encoding="UTF-8"?> 
          <TEI xmlns="http://www.tei-c.org/ns/1.0"> 
            <teiHeader> 
              <fileDesc> 
                <titleStmt> 
                  <title>類聚名義抄</title> 
                  <respStmt xml:id="KO"> 
                    <resp>TEI Encoding</resp> 
                    <persName>Kazuhiro Okada</persName> 
                  </respStmt> 
                </titleStmt> 
                <publicationStmt> 
                  <p>[Omit]</p> 
                </publicationStmt> 
                <sourceDesc> 
                  <bibl> 
                    『<title level="a">宮内庁書陵部蔵図書寮本類聚名義抄</title>』<publisher>勉誠社</publisher>、<date>1976</date> 
                  </bibl> 
                </sourceDesc> 
              </fileDesc>
              <encodingDesc>
                <charDecl>
                  <glyph xml:id="辭a">
                    <desc>⿰⿳爫𠫓⿵冂弁辛</desc>
                    <mapping type="standard">辭</mapping>
                  </glyph>
                  <glyph xml:id="辭b">
                    <desc>⿰⿱爫𠕀辛</desc>
                    <mapping type="standard">辭</mapping>
                  </glyph>
                  <glyph xml:id="辤a">
                    <desc>⿰⿳爫龴𠕁辛</desc>
                    <mapping type="standard">辤</mapping>
                  </glyph>
                </charDecl>
              </encodingDesc>
            </teiHeader> 
            <text> 
              <body> 
                <pb n="4"/> 
                <head>類聚名義抄法</head> 
                <div xml:id="rad41" type="part" n="41"> 
                  <entry xml:id="Z00421"> 
                    <form> 
                      <orth>水</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>弘</name>云</bibl> 
                        <pron type="fanqie">尸癸<metamark rend="vermilion" ana="H"/>反。</pron> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl> 
                          <name>中</name>云</bibl> 
                        <quote>所<oRef/>以潤万物 
                          <add type="gloss" place="surroundings"><metamark rend="vermilion">㆒</metamark></add> 
                        也</quote> 
                      </cit> 
                    </sense> 
                  </entry> 
                </div> 
                <div xml:id="rad43" type="part" n="43"> 
                  <pb n="74"/> 
                  <entry xml:id="Z07413"> 
                    <form> 
                      <orth><oRef target="#Z07372-1"/><!--訶-->猒</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>應</name>云</bibl> 
                        <def><oRef target="#Z07372-1"/>大言而怒也</def> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl> 
                          <name>憲</name>云 
                        </bibl> 
                        <note>亦作呵</note> 
                        <def>責也怒發聲</def> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl> 
                          <name>眞</name>云 
                        </bibl> 
                        <def>言責也。</def> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07422"> 
                    <form> 
                      <orth><oRef target="#Z07372-1"/>梨怛鷄</orth> 
                    </form> 
                    <cit> 
                      <bibl> 
                        <name>應</name>云</bibl> 
                      <def> 
                        舊云呵梨勒。翻爲天主持來。此果堪爲藥以 
                          <choice> 
                            <sic>切</sic> 
                            <corr>功</corr> 
                          </choice> 
                        用極多如此土人參石斛等。 
                      </def> 
                    </cit> 
                  </entry> 
                  <entry xml:id="Z07432"> 
                    <form> 
                      <orth><oRef target="#Z07372-1"/>羅</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl><name>應</name>云</bibl> 
                        <pron type="fanqie">古河反。</pron> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07433"> 
                    <form> 
                      <orth>不<seg xml:id="Z07433-1">計</seg></orth> 
                      <pron type="similar">音<seg xml:id="Z07433-N01">係</seg> 
                        <add corresp="#Z07433-N01" @place="right">ケ<metamark ana="R">イ</metamark></add></pron> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>弘</name>云</bibl> 
                          <quote><quote type="def">會也算也謀也</quote></quote> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl> 
                          <name>應</name>云</bibl> 
                        <def><oRef target="#Z07433-1"/>樂也。經係非也。</def> 
                      </cit> 
                      <cit type="japanese"> 
                        <quote> 
                          ハ<metamark ana="L"/>カ<metamark ana="L"/>ル<metamark ana="H"/><bibl><name><add place="bottom">月</add></name></bibl> 
                        </quote> 
                        <quote> 
                          カ<metamark ana="L"/>ソ<metamark ana="L゛"/>フ<metamark ana="H"/><bibl><name>律</name></bibl> 
                        </quote> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07442"> 
                    <form> 
                      <orth>訏</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>弘</name>云</bibl> 
                        <pron type="fanqie"> 
                          況<seg xml:id="Z07442-N01">倶</seg> 
                          <add corresp="#Z07442-N01" place="bottom left">ク<metamark ana="F"/></add>反 
                        </pron> 
                        <def>大也差也美言也僞也。</def> 
                      </cit> 
                      <cit type="japanese"> 
                        <quote>マ<metamark ana="L"/>コ<metamark ana="H"/>ト<metamark ana="H"/></quote> 
                        <quote>オ<metamark ana="L"/>ホ<metamark ana="L"/>イナリ</quote> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07444"> 
                    <form> 
                      <orth xml:id="Z07444-1">訐</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>弘</name>云</bibl> 
                        <pron type="fanqie">柯戴反</pron> 
                        <def>揚惡也。</def> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07451"> 
                    <form> 
                      <orth> 
                        <seg xml:id="Z07451-N01"><oRef target="#Z07444-1"/></seg> 
                        <add corresp="#Z07451-N01">ア<metamark ana="L"/>ハ<metamark ana="L"/>ク<metamark ana="H"/></add> 
                        群臣之德失<add type="gloss" place="over"><metamark ana="を"/></add>。 
                      </orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl><name>顔氏</name></bibl> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07453"> 
                    <form> 
                      <orth>謌</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl><name>類</name>云</bibl> 
                        <pron type="similar">哥音</pron> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07454"> 
                    <form> 
                      <orth>言<seg xml:id="Z07454-1">詞</seg></orth> 
                      <pron type="similar"> 
                        音<seg xml:id="Z07454-N01">辭</seg> 
                        <add corresp="#Z07454-N01" place="bottom left">シ<metamark ana="L"/></add> 
                      </pron> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>應</name>云</bibl> 
                        <def>意内而言外也。審言語也</def> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl> 
                          <name>中</name>云</bibl> 
                        <def> 
                          言辭也。或作<g ref="#辭a">辭</g>。不受也訟也。<g ref="#辤a">辤</g><g ref="#辭b">辭</g>辝辞四形聲類以爲皆<oRef target="#Z07454-1"/>字。新切韻<oRef tar-get="#Z07454-1"/>辭異
                        </def> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl> 
                          <name>眞</name>云</bibl> 
                        <def> 
                          言語也告也。 
                          <choice> 
                            <corr>直</corr> 
                            <sic>真</sic> 
                          </choice> 
                          言曰言
                            <add type="gloss" place="surroundings"><metamark rend="vermilion">㆒</metamark></add>
                          々己事
                            <add type="gloss" place="surroundings"><metamark rend="vermilion">㆒</metamark></add>
                          也。答述曰<oRef target="#Z07454-1"/>
                            <add type="gloss" place="surroundings"><metamark rend="vermilion">㆒</metamark></add>
                          爲人
                            <add type="gloss" place="surroundings"><metamark rend="vermilion">㆒</metamark></add>
                          説也。論語作辤・東云請也安定<oRef target="#Z07454-1"/>也。</def>
                      </cit> 
                      <cit> 
                        <quote> 
                          <unclear>コ</unclear>ト<unclear>ハ</unclear><bibl><name>選</name></bibl> 
                        </quote> 
                        <quote> 
                          <bibl><name>眞</name>云</bibl>シ<metamark ana="L"/><metamark ana="N"/> 
                        </quote> 
                      </cit> 
                      <add place="marginalia above"> 
                        <cit> 
                          <bibl> 
                            <name>俱舍</name>云</bibl> 
                          <def>詞謂訓釋言詞</def> 
                        </cit> 
                      </add> 
                    </sense> 
                  </entry> 
                  <entry xml:id="Z07474"> 
                    <form> 
                      <orth xml:id="Z07474-1">許</orth> 
                    </form> 
                    <sense> 
                      <cit> 
                        <bibl> 
                          <name>弘</name>云</bibl> 
                        <pron type="fanqie">虛語反</pron> 
                        <def>進也聽也從也然也諾也所也與<unclear>也</unclear></def> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl><name>中</name>云</bibl> 
                        <def>聽也<oRef target="#Z07474-1"/>可也</def> 
                      </cit> 
                      <pc>・</pc> 
                      <cit> 
                        <bibl><name>了義燈</name>云</bibl> 
                        <def>以悔<oRef target="#Z07474-1"/>字少相近故寫者有悞。</def> 
                      </cit> 
                      <cit> 
                        <quote>ス<metamark ana="H"/>ヽ<metamark ana="H"/>ム<metamark ana="L"/></quote> 
                      </cit> 
                    </sense> 
                  </entry> 
                  <floatingText> 
                    <body> 
                      <entry xml:id="Z07465" prev="#Z07454" next="#Z07474"> 
                        <form> 
                          <orth>祝詞</orth> 
                        </form> 
                        <sense> 
                          <cit> 
                            <quote>ノ<metamark ana="H"/>ト<metamark ana="H"/>コ<metamark ana="H゛"/>ト<metamark ana="H"/></quote> 
                            <quote>ハ<metamark ana="L"/>ラ<metamark ana="L"/>ヘ<metamark ana="L"/>コ<metamark ana="L゛"/>ト<metamark ana="L"/></quote> 
                          </cit> 
                        </sense> 
                      </entry> 
                    </body> 
                    <note><ref target="#Z07474" resp="#KO">許</ref>の下部にあり。</note> 
                  </floatingText> 
                </div> 
              </body> 
            </text> 
          </TEI>
          

5.3 参考:『色葉字類抄』

『色葉字類抄』(1177–81年ごろ)は、橘忠兼撰の字書である。いろはによって語を四十七部に分け、意義分類を施したものである。同訓の漢字を類聚した部もあることで知られる。前掲の箇所を部分的に符号化する。割書きを「聴」についてのみ保存した。


          <entry> 
            <form><orth>許</orth></form> 
            <form><pron type="japanese" xml:lang="ja">ユルス</pron><pron type="fanqie" xml:lang="zh" 
              >虚呂反</pron></form> 
            <re><form><orth>免</orth></form><form> 
              <pron type="fanqie" xml:lang="zh">亡弁反</pron></form></re> 
            <re><seg xml:id="orth3">赦</seg><add corresp="#orth3" place="right">シヤ</add></re> 
            <re><form><orth>聴</orth></form> 
              <cit><quote type="example"><oRef/>昇殿</quote><milestone unit="notes" /><form><pron type="fanqie" 
                xml:lang="zh">他定反</pron></form></cit></re> 
            <re><form><orth>祚</orth></form></re> 
            <re><form><orth>原</orth></form><sense><def>恕也</def><sense></re> 
            […] 
            <re><form><orth>税</orth></form><note>已上同</note></re> 
          </entry>
          

5.4 参考:『康煕字典』

時代はおおはばに下るが、康煕帝の命じて作られた清朝中国の字書である。中国漢字字書の掉尾を飾る書となった。


          <entry> 
            <form><orth>便</orth></form> 
            <hom> 
              <cit> 
                <bibl><name>【廣韻】</name></bibl> 
                <pron>婢面切</pron> 
              </cit> 
              <cit> 
                <bibl><name>【集韻】</name><name>【韻會】</name><name>【正韻】</name></bibl> 
                <pron>毗面切,音卞。</pron> 
                <def>順也,利也,宜也。</def> 
              </cit> 
            </hom> 
            […] 
            <hom> 
              <pc>又</pc> 
              <cit> 
                <bibl><name>【集韻】</name></bibl> 
                <pron>毗連切</pron> 
              </cit> 
              <cit> 
                <bibl><name>【正韻】</name></bibl> 
                <pron>蒲眠切,</pron> 
                <def>音駢。</def> 
              </cit> 
              <cit> 
                <bibl><name>【爾雅·釋訓】</name></bibl> 
                <def>便便,辨也。</def> 
              </cit> 
            </hom> 
          </entry>
          

6. おわりに

本モデルによって、日本の古辞書について共通の符号化が一定程度可能となった。利用と校勘を同時に要する古字書というものの性質上、原本から離れすぎることは許容しがたいが、同時に、情報交換の効率化という点で、共通要素を取り出せたのではないかと思われる。

本モデルのような符号化によって、最終的にグラフが得られれば、そこから統計的な機械処理を行う可能性も広がってくる。ここに示されるような部分的な試みではなく、全体の符号化によってさらなる検証を行いたい。

附記

本稿提出後、TEIコンソーシアム・東アジア/日本語分科会および国文学研究資料館・「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」研究開発系共同研究「TEI(Text Encoding Initiative)の導入」より、「日本語古典籍TEI本文データ作成要領」が公開された(https://github.com/TEI-EAJ/jpn_classical、2020年3月)。あわせてご参照願う。

謝辞

本稿の一部は「漢デジ2019」(2019年8月24日、於北海道大学)で発表された。また、本稿をなすにあたっては、日本学術振興会科学研究費補助金JP19H00526(研究代表者:池田証壽)の援助を受けた。本稿をなすうえで李媛氏(北海道大学)および申雄哲氏(崇実大学校)との議論に触発されるところが大きかった。また、査読者から貴重なご指摘をいただいた。記して感謝申し上げる。

Footnotes

Ikeda, “Japanization,” 15–16; Li, Shin, and Okada, “Japanese Rendition,” 83–85.

Li, Shin, and Okada, “Japanese Rendition,” 86. 記号類は除外した。

李「古辞書の構造化記述の試み」3

HDIC版(Version: 1.0.36、2019年3月)による。 https://github.com/shikeda/HDIC/

Li, Shin, and Okada, “Japanese Rendition,” 88. 記号類は省いた。〈 〉は二行割り書き、( )は振り仮名の意。

イデ・スパーバーグ=マックイーン・バーナード「TEI」。

TEI Consortium, “Dictionaries,” P5 Guidelines.

TEI Consortium, “Dictionaries,” P5 Guidelines.

HDIC版(Ver. 1.0.48、2019年9月)による。

申「本文解読とデータベース作成」。

劉ほか「部首分類体日本古辞書」。

藤本・韓・高田「古辞書の構造化記述の試み」。

李「古辞書の構造化記述の試み」。

申「構造化テキストの設計と実践」。

劉ほか「部首分類体日本古辞書」、100

Bański, Bowers, and Erjavec, “TEI-Lex0 Guidelines”

@によって属性の名前を示す。このばあいは、type="fascicle"となることを示す。なお、属性の値は、制御文字・空白文字以外のすべてのUnicodeの文字を用いることができるため、日本語を用いることもできるが、細かすぎるものとならないよう、ここでは英語による内容を提案している。

https://tei-c.org/release/doc/tei-p5-doc/en/html/ref-entry.html

参考文献
  • 1)    Ikeda,  Shoju . “ Japanization in the Field of Classical Chinese Dictionaries,” Journal of the Graduate School of Letters , no. 6 ( March 2011): pp. 15– 16.
  • 2)    Li,  Yuan , Woongchul Shin, and  Kazuhiro  Okada . “ Japanese Rendition ofTenrei bansho meigi’s Definition in Early Japanese Lexicography: An Essay ,” Journal of the Graduate School of Letters , no. 11 ( March 2016): pp. 83– 96.
  • 3)    李  媛 「 TEI P5 Dictionariesモジュールに基づく古辞書の構造化記述の試み: 篆隷万象名義を中心に」 『 情報処理学会研究報告』 2018-CH-117, no. 5( 2018年 5月): pp. 1– 8.
  • 4)    イデ、ナンシー ;  C. マイケル・  スパーバーグ=マックイーン ;  ルー・  バーナード 「 TEI: それはどこからきたのか.そして、なぜ、今もなおここにあるのか?」 『 デジタル・ヒューマニティーズ』 1( 2018年 12月)、 pp. 3– 28.
  • 5)   TEI Consortium . P5: Guidelines for Electronic Text Encoding and Interchange, Version 3.6.0, revision daa3cc0b9 ( July 2019), https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html
  • 6)    申  雄哲 「 図書寮本類聚名義抄の本文解読とデータベース作成の問題点」 漢デジ2016、 2016年 8月。
  • 7)    劉  冠偉 ・  李  媛 ・  鄭  門鎬 ・  張  馨方 ・  池田  証壽 「 部首分類体日本古辞書の項目構造の多様性に対応したマークアップ・ツールの開発」 『 人文科学とコンピュータシンポジウム2017予稿集』( 2017年 12月)、pp. 97–102。
  • 8)    藤本  灯 ・  韓  一 ・  高田  智和 「 古辞書の構造化記述の試み: 和名類聚抄を例に」 日本語学会2017年度秋季大会、 2017年 10月。
  • 9)    申  雄哲 「 図書寮本『類聚名義抄』の構造化テキストの設計と実践」 国際シンポジウム「古辞書研究の射程」、 2018年 8月。
  • 10)    Bański,  Piotr ,  Jack  Bowers , and  Tomaž  Erjavec . “ TEI-Lex0 Guidelines for the Encoding of Dictionary Information on Written and Spoken Forms,” eLex 2017 ( Sep 2017).
  • 11)    申  雄哲 「 図書寮本類聚名義抄の基礎的研究」 北海道大学大学院博士論文、 2015年 3月。
 

この記事はクリエイティブ・コモンズ [表示 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by/4.0/deed.ja
feedback
Top