自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
表層表現に着目した自由回答アンケートの意図に基づく自動分類
乾 裕子村田 真樹内元 清貴井佐原 均
著者情報
ジャーナル フリー

2003 年 10 巻 2 号 p. 19-42

詳細
抄録

自由記述形式のアンケート調査の回答は, 選択型回答のアンケートと異なり, 回答者の自由な意見を集約できる効果があるため社会的にも注目されている. アンケート調査 (質問紙調査法) について研究されてきた社会学・心理学の分野では, アンケートの回答分類はコーディングと呼ばれ, 選択型回答・自由回答ともに人手で分析・分類されることが多い. 特に自由回答のコーディングには多大なコストがかかるうえに, 人の判断による作業は主観的な分類結果を招くという懸念もある. このような背景から, 本研究では言語処理の要素技術であるテキスト分類の技術を取り入れアンケート回答の自動分類を行うことで, その結果を自由回答のコーディングに活用するためのコーディング支援を試みた. テキストの分類には, 学習アルゴリズムのひとつである最大エントロピー法を用いている. 分類にあたり, まずはテキストへのタグ付与実験をもとに意図タグの決定を行った. これらの意図タグを付与した意図タグ付き正解データを作成し, このデータを訓練データとしてN-gram抽出を行い, 各タグに特徴的な表現を取り出した. この表現を素性とし, 訓練データに対して最大エントロピー法を用いて学習し, 分類を行った結果, 約8割弱の分類精度が得られた. この手法によって, 自由回答テキストに対して回答者の意図を反映した分類を行うことができた. これにより, 回答を一件ずつ読みながら類似の内容を持つ回答を探すという, 自由回答の人手による分類コストを軽減することができた. また, 辞書を用いる形態素解析を使わずに, 最大エントロピー法による素性と意図タグの学習を行うことで, 「です」「ません」「べき」「必要」「図る」「化」など断片的な情報が意図タグ付与に効果的であることが明らかになった.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top