人工知能学会全国大会論文集
第32回全国大会(2018)
セッションID: 2L1-04
会議情報

数学用語をクエリとするWeb上のPDF文書を対象とした数式検索
*山田 奉子村上 晴美
著者情報
会議録・要旨集 フリー

詳細
抄録

Web上の数式は自然言語で注釈をつけられていないので,通常の検索エンジンを用いて検索をすることは難しい.提案手法は,数学用語をクエリとしてWeb検索を行い,得られたPDF文書からクエリに関連する数式を抽出するものである.先ず,PDFをTeXに変換後,TeXの数式記述から画像を作成し画像特徴量を得る.この画像特徴量を用いて,数式とクエリとの関連をSVMで判定する.PDFのみ,HTMLのみ,及び両方を用いて比較実験を行った.実験の結果,MRRにおいて,PDFとHTMLの両方を用いた値が最も良かった.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top