2022 年 29 巻 3 号 p. 807-834
意志性と主語有生性はイベントの基本的な属性であり,密接な関係にある.これらの認識は文脈を考慮したテキスト理解を必要とし,その学習には大量のラベル付きデータを要する.本論文では,人手でラベル付きデータを構築することなく,意志性と主語有生性を同時学習する手法を提案する.提案手法では生コーパス中のイベントにヒューリスティクスを用いてラベルを付与する.意志性のラベルは「わざと」や「うっかり」といった意志性を示す副詞を頼りに付与する.主語有生性のラベルは知識ベースに登録されている有生名詞・無生名詞を頼りに付与する.こうして集めたイベントから手がかり語を含まないイベントに汎化する分類器を構築する.本研究ではこの問題をバイアス削減ないしは教師なしドメイン適応の問題とみなして解く.日本語と英語の実験で,提案手法により,人手でラベル付きデータを構築することなく,意志性・主語有生性の高精度な分類器を構築できることを示した.