自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
下岡 和也内元 清貴河原 達也井佐原 均
著者情報
ジャーナル フリー

2005 年 12 巻 3 号 p. 3-17

詳細
抄録
『日本語話し言葉コーパス (CSJ) 』を対象として係り受け解析や文境界推定を自動で行なう手法について述べる.話し言葉の独話において, 係り受け解析を行なう際に最も大きな問題となるのは, 文境界が明示されていないことである.本論文では, 文境界推定の精度を向上させる2つの手法を提案する.1つは係り受け情報を用いた統計的機械翻訳に基づく手法, もう1つはSVMを用いたテキストチャンキングに基づく手法である.提案手法により, 文境界精度はF値で最大84.9となった.また, 文境界推定精度が向上することにより, 係り受け解析の精度も75.2%から77.2%に改善された.このように, 自動推定した係り受け, 文境界の情報を相互に利用することにより, 係り受け解析精度, 文境界推定精度ともに改善されることが示された.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top