自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
既存のツールと結合した話し言葉コーパス利用環境
伝 康晴小磯 花絵
著者情報
ジャーナル フリー

2014 年 21 巻 2 号 p. 99-123

詳細
抄録
近年,コーパスアノテーションは多様化し,多層アノテーションを統合利用する仕組みが欠かせない.とくに話し言葉コーパスでは,言語・非言語に関する 10 種類以上もの単位とそれらの相互関係を統合し,複数の単位を組み合わせた複雑な検索を可能にする必要がある.本研究では,このような要請に応えるため,(1) マルチモーダル・マルチチャネルの話し言葉コーパスを表現できる,汎用的なデータベーススキーマを設計し,(2) 既存のアノテーションツールで作成された,種々の書式を持つアノテーションを入力とし,汎用的なデータベーススキーマから具現化されたデータベースを構築するツールを開発する.話し言葉の分野では,広く使われている既存のアノテーションツールを有効に利用することが不可欠であり,本研究は,既存のアノテーションツールやコーパス検索ツールを用いたコーパス利用環境を構築する手法を提案する.提案手法は,開発主体の異なる複数の話し言葉コーパスに適用され,運用に供されている.
著者関連情報
© 2014 言語処理学会
前の記事 次の記事
feedback
Top