抄録
発表者はCNN(Convolutional Neural Networks)を利用して、漢字を構成する部首検出の問題に取り込んでいる。本研究の目的は、漢字のように、局所的に見ても単な線構造でしかない文字を、正しく部首単位に分離できる能力をCNNが持つかどうかを見極めることである。更に、「まだれ」や「かこい」のようにその内部に別のストロークがある場合に正しい検出ができるか、「火へん」や「さんずい」のような複数の連結成分からなる部首が検出できるかについても興味深い。このように本研究は、表面的には「漢字からの部首検出」という問題であるが、その本質はCNNの構造分離能力を漢字というわかりやすいパターンで検証することにある。