自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
談話指標とテキスト長を用いた講演音声とプレゼンテーション資料の対応付け
中澤 聡佐藤 研治奥村 明俊
著者情報
ジャーナル フリー

2005 年 12 巻 2 号 p. 133-156

詳細
抄録

テキスト検索と同様に, 大量に録画・蓄積されたビデオデータに対しても, 利用者の求めるシーンをキーワード検索する機能が求められている・そうしたビデオ検索の手法としては, ビデオの音声信号に音声認識を行って得られた結果を, 時間情報付きの言語インデックスとし, 映像検索に利用する研究がある.しかし, 音声認識には誤認識や未知語の問題があり, 認識結果をそのままインデックスとするのは難しい.一方, ビデオ音声の詳細な原稿や書き起こしが利用可能な場合には, 原稿と音声認識結果とを対応づけることで, ビデオと同期した正確な言語インデックスを得ることができる.ただし, 詳細な原稿が存在するコンテンツは限られてくる.そこで本研究では, 原稿がなくともプレゼンテーション資料が存在するような講義・講演映像を対象にして, 音声認識結果とプレゼンテーション資料中のテキストという, 性質・分量の異なる2種類のテキストを対応付けることで, プレゼンテーション資料を元の講義・講演映像の言語インデックスとする手法を提案する.対応付けはプレゼンテーション資料のスライド単位でとる.これにより, スライド単位で, プレゼンテーション資料のテキストを介した講義・講演映像のキーワード検索が可能となる.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top