抄録
『日本語話し言葉コーパス (CSJ) 』を対象として係り受け解析や文境界推定を自動で行なう手法について述べる.話し言葉の独話において, 係り受け解析を行なう際に最も大きな問題となるのは, 文境界が明示されていないことである.本論文では, 文境界推定の精度を向上させる2つの手法を提案する.1つは係り受け情報を用いた統計的機械翻訳に基づく手法, もう1つはSVMを用いたテキストチャンキングに基づく手法である.提案手法により, 文境界精度はF値で最大84.9となった.また, 文境界推定精度が向上することにより, 係り受け解析の精度も75.2%から77.2%に改善された.このように, 自動推定した係り受け, 文境界の情報を相互に利用することにより, 係り受け解析精度, 文境界推定精度ともに改善されることが示された.