本稿ではノンパラメトリックベイズモデルに基づく言語モデルである可変長階層 Pitman-Yor 言語モデルを用いたメ
ロディ
ー生成手法を提案する.従来の n-gram モデルを用いたメ
ロディ
ー生成手法ではスパースネスの問題から短い n-gram 文脈長しか扱う事ができず,不自然なメ
ロディ
ーが多く生成されるという問題があった.そこで,本研究では学習データに応じて各単語の n-gram 文脈長を適切に推定する事のできる可変長階層 Pitman-Yor 言語モデルを用いたメ
ロディ
ー生成手法を提案する.本提案手法は柔軟に制約やバイアスを加えながらも,ギブスサンプリングを用いる事で少ない計算量でメ
ロディ
ーを生成する事が可能である.また,ギブスサンプリングを用いる事でインタラクティブ性を容易に確保できる.また,モデルの性質からスパースネスの問題が緩和され,従来のモデルよりも長いフレーズを学習する事が可能であり,さらにメモリ使用量も大幅に減らす事ができる.本稿では提案手法を用いてメ
ロディ
ーの生成を行い,学習データ内の様々な長さのフレーズがつなぎ合わさったようなメ
ロディ
ーが生成される事を示した.また,感性評価実験によって短い n-gram 文脈長しか扱う事のできなかった従来モデルから生成したものよりも自然で滑らかなメ
ロディ
ーが生成されることを示した.
抄録全体を表示