情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
記事
古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発
山本 純子大澤 留次郎
著者情報
ジャーナル フリー HTML

2016 年 58 巻 11 号 p. 819-827

詳細
抄録

現代に生きるほとんどの日本人は「くずし字」で書かれた古典籍を読めず,大量に現存する古典籍の内容がわからなくなりつつある。そこで,負荷の高い翻刻の省力化を目的に,新方式OCRを開発した。くずし字を含む古典籍を対象とした原理検証実験の結果,一定の条件下で,精度80%以上の自動テキストデータ化が可能であることを実証した。新方式OCRでは,文字画像を位置情報とともに切り出した字形データベースを構築。この字形データベースから類似字形検索により翻刻対象古典籍の文字の文字コードを特定する。また,完全自動化ではなく,人手と自動処理を組み合わせた作業工程設計により翻刻の総合的な負荷軽減を目指す。新方式OCRの仕組みと,これを用いた翻刻の現況を報告する。

著者関連情報
© 2016 Japan Science and Technology Agency
前の記事 次の記事
feedback
Top