NHKでは,日本語音声合成の研究開発を行い,その技術を総合テレビやラジオ第一放送等で実用化している.本稿では,放送品質の日本語音声合成の研究開発とその実用化について示す.日本語は漢字,平仮名,片仮名の3種類の文字列で構成される複雑な言語であり,最新の音声合成研究を日本語に適用するには課題があった.この問題を解決するために,放送品質の日本語音声合成を実現する手法を考案したので報告する.本稿では,その手法と有効性とともに,その実用例を示す.具体的には,NHK総合テレビの「おはよう日本」や「NHKニュース」で「AI自動音声」,ラジオ気象情報を自動送出する「ラジオ気象AIアナウンスシステム」としての音声合成の放送利用と,「NHK音声版番組表」,「命を守る“防災の呼びかけ”」などの放送外のサービスについて実用例を示す.
テレビ番組などで映像を編集する際,プライバシー保護のために被写体の一部にぼかしやモザイクをかけることがある.そのような被写体をAIで検出し,自然なぼかしやモザイク効果を自動で行う技術「BlurOn」を紹介する.
東京ドームに約100台の専用カメラを設置し,プレーから約3秒後に生成するボリュメトリックビデオ(自由視点映像)をプロ野球中継に導入した.本技術によって360度自由なカメラワークで中継を行うことが可能となり,野球中継における革新的な表現の拡大につながった.機材間の接続,同期の手法や,幅広い撮影範囲への対応,さらにはボリュメトリックビデオの特性を活かした番組演出など多くの工夫を行ったことによって,新しい視聴体験の提供が実現できた.