2021.12.09
音声変換に関する論文が音声処理系の国際学会「APSIPA 2021」に採択されました
アルバイトでAI研究開発に参加している阿久澤 圭さんが執筆した「Conditional Deep Hierarchical Variational Autoencoder for Voice Conversion」が音声処理の国際会議「APSIPA 2021」に採択されました。
本論文では、Conditional Deep Hierarchical Variational Auto-Encoder (CDHVAE)という非常に深いニューラルネットを用いた音声変換モデルを提案し、その性能が従来の同様の手法を上回ることを示しました。音声変換における従来のVAEを用いた研究の流れ(補助的な損失関数の追加等)とは異なり、「より深層でモデルの性能が高いVAEの活用が、音声変換タスクでどれだけ効果的か?」という疑問に注目した点で新しく、その研究成果は音声変換技術の新たな知見を提供します。
下記のプロジェクトページにデモもありますので、ご確認ください。https://dena.github.io/CDHVAE/