抄録
書き言葉で使われる語彙と, 話し言葉で使われる語彙には大きな違いがある. そのため, 書き言葉テキストから合成された音声は不自然なものとなってしまう. 書き言葉テキストからでも自然な音声の合成を可能にするために, 本論文では, 書き言葉特有語彙から話し言葉語彙への言い換えを学習する手法を提案する. ある表現が書き言葉特有語彙であるか, 話し言葉語彙であるかは, その表現の書き言葉コーパスでの出現確率と話し言葉コーパスでの出現確率をもとにして判断する. 書き言葉コーパスと話し言葉コーパスはWWWから自動収集したものを用いる. 実験の結果, 書き言葉コーパスと話し言葉コーパスの収集精度は94%, 言い換え学習の精度は79%であり, 提案手法の有効性を示すことができた.