自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
WWWを用いた書き言葉特有語彙から話し言葉語彙への用言の言い換え
鍛治 伸裕岡本 雅史黒橋 禎夫
著者情報
ジャーナル フリー

2004 年 11 巻 5 号 p. 19-37

詳細
抄録

書き言葉で使われる語彙と, 話し言葉で使われる語彙には大きな違いがある. そのため, 書き言葉テキストから合成された音声は不自然なものとなってしまう. 書き言葉テキストからでも自然な音声の合成を可能にするために, 本論文では, 書き言葉特有語彙から話し言葉語彙への言い換えを学習する手法を提案する. ある表現が書き言葉特有語彙であるか, 話し言葉語彙であるかは, その表現の書き言葉コーパスでの出現確率と話し言葉コーパスでの出現確率をもとにして判断する. 書き言葉コーパスと話し言葉コーパスはWWWから自動収集したものを用いる. 実験の結果, 書き言葉コーパスと話し言葉コーパスの収集精度は94%, 言い換え学習の精度は79%であり, 提案手法の有効性を示すことができた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top