自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
集合分割問題に基づく系列アラインメントのモデル化
西野 正彬鈴木 潤梅谷 俊治平尾 努永田 昌明
著者情報
ジャーナル フリー

2016 年 23 巻 2 号 p. 175-194

詳細
抄録
2 つの系列が与えられたときに,系列の要素間での対応関係を求めることを系列アラインメントとよぶ.系列アラインメントは,自然言語処理分野においても文書対から対訳関係にある文のペアを獲得する対訳文アラインメント等に広く利用される.既存の系列アラインメント法は,アラインメントの単調性を仮定する方法か,もしくは連続性を考慮せずに非単調なアラインメントを求める方法かのいずれかであった.しかし,法令文書等の対訳文書に対する対訳文アラインメントにおいては,単調性を仮定せず,かつ対応付けの連続性を考慮できる手法が望ましい.本論文では,ある大きさの要素のまとまりを単位として系列の順序が大きく変動する場合にアラインメントを求めるための系列アラインメント法を示す.手法のポイントは,系列アラインメントを求める問題を組合せ最適化問題の一種である集合分割問題として定式化して解くことで,要素のまとまりの発見と対応付けとを同時に行えるようにした点にある.さらに,大規模な整数線形計画問題を解く際に用いられる技法である列生成法を用いることで,高速な求解が可能であることも同時に示す.
著者関連情報
© 2016 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top