自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文
複単語表現を考慮した依存構造コーパスの構築と解析
加藤 明彦進藤 裕之松本 裕治
著者情報
ジャーナル フリー

2019 年 26 巻 4 号 p. 663-688

詳細
抄録

複単語表現 (MWE) は統語的または意味的な非構成性を有する複数の単語からなるまとまりである.統語的な依存構造の情報を利用し,かつ意味理解が必要なタスクでは,単語ベースの依存構造よりも MWE を考慮した依存構造,即ち MWE を統語的な単位とする依存構造の方が好ましい.広範囲の連続MWEを依存構造で考慮するために,本稿では Ontonotes コーパスに対して新たに形容詞 MWE を注釈し,複合機能語と形容詞 MWE の双方を考慮した依存構造コーパスを構築した.また,意味理解が必要なタスクでは句動詞などの非連続な出現を持ちうる MWE(動詞 MWE)の認識も重要である.依存構造の情報は動詞 MWE 認識で有効な特徴量として働くと期待されるため,本稿では連続 MWE を考慮した依存構造と動詞 MWE の双方を予測する問題に取り組む.前者については以下の 3 つのモデルを検討する: (a) 連続MWE認識と,MWE を考慮した依存構造解析のパイプライン,(b) 連続MWEの範囲を依存関係ラベルとして符号化した head-initial な依存構造を解析するモデル,および (c) 連続MWE認識と上記 (b) の階層的マルチタスク学習モデルである.実験の結果,連続MWE認識ではパイプラインモデルとマルチタスクモデルがほぼ同等の F 値を示し,head-initial な依存構造の解析器を 1.7 ポイント上回った.動詞MWE認識では系列ラベリングベースの認識器を上述のマルチタスクモデルに組み込むことで F 値が 1.3 ポイント向上した.

著者関連情報
© 2019 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top