知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
原著論文
可変長階層 Pitman-Yor 言語モデルを用いたメロディー生成手法の提案
白井 亨谷口 忠大
著者情報
ジャーナル フリー

2013 年 25 巻 6 号 p. 901-913

詳細
抄録
本稿ではノンパラメトリックベイズモデルに基づく言語モデルである可変長階層 Pitman-Yor 言語モデルを用いたメロディー生成手法を提案する.従来の n-gram モデルを用いたメロディー生成手法ではスパースネスの問題から短い n-gram 文脈長しか扱う事ができず,不自然なメロディーが多く生成されるという問題があった.そこで,本研究では学習データに応じて各単語の n-gram 文脈長を適切に推定する事のできる可変長階層 Pitman-Yor 言語モデルを用いたメロディー生成手法を提案する.本提案手法は柔軟に制約やバイアスを加えながらも,ギブスサンプリングを用いる事で少ない計算量でメロディーを生成する事が可能である.また,ギブスサンプリングを用いる事でインタラクティブ性を容易に確保できる.また,モデルの性質からスパースネスの問題が緩和され,従来のモデルよりも長いフレーズを学習する事が可能であり,さらにメモリ使用量も大幅に減らす事ができる.本稿では提案手法を用いてメロディーの生成を行い,学習データ内の様々な長さのフレーズがつなぎ合わさったようなメロディーが生成される事を示した.また,感性評価実験によって短い n-gram 文脈長しか扱う事のできなかった従来モデルから生成したものよりも自然で滑らかなメロディーが生成されることを示した.
著者関連情報
© 2013 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top