2019 年 48 巻 1 号 p. 153-160
本論文では,Maxoutフィルタネットワークを用いて印刷文書に書き込まれた手書き文字を抽出する方法を提案する.文書画像処理において,印刷された文字とメモ書きなどの手書き文字が混在している文書画像から,手書き文字のみを抽出することができれば,原印刷物の復元,メモ書きの編集及びテキスト化などが実現できる.本論文では,手書き文字を抽出するために,Maxout活性化関数によって構成されたネットワークを適用する.Maxoutフィルタはモフォロジカルフィルタの拡張であり,形状に関するフィルタリングの能力を持つ.本論文では,手書き文字の抽出を目的として,従来のMaxoutフィルタネットワークを改良し,出力段で入力データとネットワークの出力を比較してその最大値を出力する新しいネットワーク構成を導入する.加えて,複数の記入者に対応するために,記入者ごとに入力データとネットワーク出力との二乗誤差の勾配の平均を計算し,パラメータを学習するバッチ学習を導入する.実験では,従来のMaxoutネットワークとの比較を行い,有効性を確認している.