2023 年 79 巻 1 号 p. 9-17
本論文では,テキスト音声合成の中でも特にEnd-to-End音声合成時代に向けた大規模日本語コーパスROHANを提案する。ROHANは常用漢字すべてを網羅しつつ,日本語文章では出現しにくいモーラを一定数含めるモーラバランスを重視している。オリジナルのコーパス文4,600文を22のサブセットとして構築しており,パブリックドメインのライセンスで公開している点も,本コーパスの特色である。本論文では,ROHANの設計コンセプトと具体的な作成手順を示し,各モーラの出現回数やコーパス文の平均モーラ数などの解析結果を示す。モーラ出現頻度に関するエントロピー,及び音素の拡張エントロピーによる評価から,既存のコーパスよりもモーラ・音素バランスに優れていることも示す。