抄録
近年,コーパスアノテーションは多様化し,多層アノテーションを統合利用する仕組みが欠かせない.とくに話し言葉コーパスでは,言語・非言語に関する 10 種類以上もの単位とそれらの相互関係を統合し,複数の単位を組み合わせた複雑な検索を可能にする必要がある.本研究では,このような要請に応えるため,(1) マルチモーダル・マルチチャネルの話し言葉コーパスを表現できる,汎用的なデータベーススキーマを設計し,(2) 既存のアノテーションツールで作成された,種々の書式を持つアノテーションを入力とし,汎用的なデータベーススキーマから具現化されたデータベースを構築するツールを開発する.話し言葉の分野では,広く使われている既存のアノテーションツールを有効に利用することが不可欠であり,本研究は,既存のアノテーションツールやコーパス検索ツールを用いたコーパス利用環境を構築する手法を提案する.提案手法は,開発主体の異なる複数の話し言葉コーパスに適用され,運用に供されている.