抄録
デジタル映像機器の普及により,個人が自分の周囲を撮影し記録として残すことも多くなった.そのような情景画像の中には看板等の画像を特徴づける有意な文字情報が多数含まれており,その情報抽出のために文字領域の検出や文字認識の研究が近年盛んに行われている.従来,情景画像内の文字領域検出では,多種多様な文字画像を用いて文字を形作る特徴を学習によって抽出していた.しかし,多様な形状をもつ文字から普遍的な特徴を抽出することは難しく, 複雑な背景テクスチャをもつ情景画像においては誤検出が発生することも多い.
本研究では,認識対象画像から学習用のデータを作成することで認識対象画像に存在する可能性の高いデータを多数用いて学習を行い,認識対象画像の特徴を反映した学習を実現する.具体的には,対象画像からの無作為抽出により背景画像を取得し,文字サンプルと組み合わせることで学習に用いる為のデータを構築する.