自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文
単語分散表現に基づく単一言語内フレーズアラインメント
吉仲 真人梶原 智之荒瀬 由紀
著者情報
ジャーナル フリー

2021 年 28 巻 2 号 p. 508-531

詳細
抄録

本研究では,単語分散表現に基づく単一言語内フレーズアラインメント手法を提案する.単一言語内フレーズアラインメントは,同一言語の文対に含まれる言い換えフレーズを対応付けるタスクである.既存手法は大規模な辞書や高品質な構文解析器を使用しており,依存する言語資源の観点から英語以外の言語への拡張が難しい.提案手法は学習済みの単語分散表現のみを用いるため,多くの言語において大規模に利用可能な単言語のコーパスのみに依存する.提案手法では,はじめに単語分散表現に基づいて単語アラインメントを獲得し,次に対訳フレーズアラインメントのヒューリスティクスを用いてフレーズアラインメントの候補を得る.最後に,単語分散表現から構成したフレーズ表現を用いて計算したアラインメントスコアに基づいて,適切なフレーズ対の組み合わせをラティス構造を用いて探索する.英語での評価実験により,既存のフレーズアラインメント手法を上回るF値を達成し,性能の改善を確認した.また,日本語のデータセットを構築して行った分析では,英語以外の言語へ容易に適用できることを確認した.

著者関連情報
© 2021 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top