抄録
2 つの系列が与えられたときに,系列の要素間での対応関係を求めることを系列アラインメントとよぶ.系列アラインメントは,自然言語処理分野においても文書対から対訳関係にある文のペアを獲得する対訳文アラインメント等に広く利用される.既存の系列アラインメント法は,アラインメントの単調性を仮定する方法か,もしくは連続性を考慮せずに非単調なアラインメントを求める方法かのいずれかであった.しかし,法令文書等の対訳文書に対する対訳文アラインメントにおいては,単調性を仮定せず,かつ対応付けの連続性を考慮できる手法が望ましい.本論文では,ある大きさの要素のまとまりを単位として系列の順序が大きく変動する場合にアラインメントを求めるための系列アラインメント法を示す.手法のポイントは,系列アラインメントを求める問題を組合せ最適化問題の一種である集合分割問題として定式化して解くことで,要素のまとまりの発見と対応付けとを同時に行えるようにした点にある.さらに,大規模な整数線形計画問題を解く際に用いられる技法である列生成法を用いることで,高速な求解が可能であることも同時に示す.