抄録
近年,対話システムの普及に伴い,機械が言語的ユーモアを理解する必要性が高まっている.これまでの研究において,駄洒落などの韻文のユーモアを対象に大規模な自然文の集合から検出を試みた例は確認されていない.駄洒落を含む文をブログテキストよりSVMを用いて分類する手法を提案し,有効な素性を調べるため,駄洒落全般の類型別の構成比の標本調査を行った.その結果,文内に音韻的に類似した1形態素およびそれに対応する音素列を有する駄洒落の類型が支配的であることが判明した.このため本論文では,語彙素性に加え,音韻類似度に基づく音韻類似区間の検出ルールを素性としたSupport Vector Machineを用いた分類による検出手法を提案する.検出性能評価実験の結果,提案手法におけるルールベース素性の付加の有効性が確認された.