自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
Skew Divergenceに基づく文書の母語話者性の推定
藤井 宏冨浦 洋一田中 省作
著者情報
ジャーナル フリー

2005 年 12 巻 4 号 p. 79-96

詳細
抄録

母語話者/非母語話者文書を自動的に高精度で判別する技術は, 良質コーパスの作成支援, 非母語話者の文書推敲支援, 第二言語習得に有益な知識獲得などの面で重要な役割を果たす.本論文では, 品詞trigram分布の相違度に基づく母語話者/非母語話者文書判別法を提案する.確率分布の相違度として, ゼロ頻度問題に対処できるSkew Divergenceを用いる.Skew Divergenceはパラメタαを設定する必要があるが, 現在その設定法に定石は存在しない.本論文ではSkew Divergenceのパラメタαの設定法についても議論する.英語科学技術論文を対象にした判別実験の結果, 提案手法の有効性が確認された.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top