抄録
本論文では数式の二次元の位置構造に着目したパターンマッチング手法について述べる.ここで,二次元の位置構造とは,分数やべき乗などの記号が水平に並んでいないような構造を指す.数式のパターンマッチングにおいて,我々は数式の二次元的な位置構造が文字列の入れ子構造によって構成されているとみなす.対象とする数式はMathMLのPresentation Markupによって記述されたものとする.Presentation Markupでは,同じ見た目を持つ数式を記述するために複数の方法を用いることができ,データにゆらぎが生じることが多い.したがって,MathMLの仕様書で推奨される記述方法に対応するのみでは,実用上,検索機能として不十分である.そこで我々は,MathMLデータを一意化する正規化処理を行うことで,データのゆらぎに対応した頑健性の高い検索を実現する.