自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
計算機処理のための韓国語言語体系と形態素処理
山本 和英
著者情報
ジャーナル フリー

2000 年 7 巻 4 号 p. 25-62

詳細
抄録

韓国語の言語処理, 特に韓国語を原言語もしくは目的言語とする機械翻訳における, 韓国語の言語体系と形態素処理手法を提案する. 本論文の韓国語体系の特徴は, 機械処理を考慮した体系であるという点にある. すなわち, 形態素解析の解析精度や機械翻訳における品詞設定の必要性に応じて, 韓国語各品詞に対して仕様の検討を行ない, 設計を行なった. また分かち書きや音韻縮約といった韓国語の特徴をどのように機械処理すべきかについても述べる. 韓国語形態素解析では, 品詞と単語の混合n-gramによる統計的手法を基本としながら, 韓国語固有の問題に対しては残留文字などの概念を導入するなどして独自の対応を施した. 以上の品詞体系と形態素解析エンジンによって, 単語再現率99.1%, 単語適合率98.9%, 文正解率92T6%という良好な解析精度が得られた. また韓国語生成処理では, 特に分かち書き処理についてどのような規則を作成したのかについて提案を行なう. 以上の形態素体系と処理の有効性は, 機械翻訳システムTDMTの日韓翻訳, 韓日翻訳部に導入した際の翻訳精度という形で文献 (古瀬, 山本, 山田1999) において報告されている.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top