主催: 社団法人 人工知能学会
会議名: 2010年度人工知能学会全国大会(第24回)
回次: 24
開催地: 長崎県長崎市 長崎ブリックホール
開催日: 2010/06/09 - 2010/06/11
テキスト・音声等から得られる符号系列に対し、符号の出現パターンの同質性に着目して、意味的に同質な部分区間に分割する領域非依存なトピック分割アルゴリズムを提案する。全ての(ギャップを含む)部分符号列の出現頻度に基づく任意の部分区間の類似性を文字列カーネルを用いて計算し、動的計画法により最適な分割を計算するこのアルゴリズムを、テキスト・音声コーパスに適用し、既存手法との性能比較を行う。