自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
候補間の表層的差異に着目した地名の所属国推定
佐野 智久延澤 志保岡本 紘幸鈴木 宏哉松原 正樹斎藤 博昭
著者情報
ジャーナル フリー

2010 年 17 巻 1 号 p. 1_29-1_54

詳細
抄録

地名等の固有名詞は自然言語処理における未知語処理問題の要因の一つであり,これを自動的に認識する手法が盛んに研究されている.本稿では,地名の所属国を自動的に推定することで,未知語としてノイズの原因となる可能性のある地名語句に情報を与えることを目的とする.固有名詞である地名の認識では地名辞書が用いられることが多いが,辞書ベースの手法では,辞書未登録語の問題が避けられない.不特定多数の外国の地名も含めた所属国の推定の実現のため,本稿では,地名辞書や文脈情報を全く使用せず,地名の表層情報のみを利用して,地名の所属国を自動的に判別する手法を提案する.地名については,言語的な類似性や地理的要因によって所属国の判別が困難な場合がある.本稿ではこの点に着目し,所属可能性の低い国の除去による候補の絞込み処理と,所属可能性の高い候補の選択処理との組合せによって,再現率を高く保ったまま適合率の向上を実現した.

著者関連情報
© 2010 言語処理学会
前の記事 次の記事
feedback
Top