自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
国文学作品のテキストデータ記述ルールについて
安永 尚志
著者情報
ジャーナル フリー

1996 年 3 巻 4 号 p. 3-29

詳細
抄録
国文学作品の電子化テキストのためのデータ記述ルールについて検討した. 様々な国文学作品の特徴を整理し, 電子化テキストの目的と研究対象をまとめ, 必要なデータ記述のための機能や情報構造について考察している. データ記述の基本原則を作品の構造とテキストの構造に分けて考察し, またデータ表記の様相を分析, 評価し, ルール化についてまとめている. 3つの基本ルールから成るKOKINルールと呼ぶデータ記述文法を定義し, 作成した. これは国文学作品を対象とする電子化テキスト記述用のマークアップ文法である. ルールに基づく電子化データを実際に作成し, ルールの構文の正当性やルールの有用性などについて評価している. 例えば, 電子化データのテキストデータベースやCD-ROMへの登録, SGMLへの変換などを行っている. これらの結果, ルールの有効性が確認され, 実用性についても高く評価された.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top