Loading
DeNA AI
contact

NEWS

音声合成に関する論文が音声処理系トップカンファレンス「INTERSPEECH 2020」にて採択されました


タイトル

音声合成に関する論文が音声処理系トップカンファレンス「INTERSPEECH 2020」にて採択されました

内容

アルバイトの後藤駿介さんと大西弘太郎さんがメインとなった「Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image」が音声処理系のトップカンファレンス「INTERSPEECH 2020」にて採択されました。この論文では、「顔画像から推定される埋め込みベクトルを用いたDNN複数話者音声合成モデル」を提案しました。 主観評価実験の結果、顔画像から推定される埋め込みベクトルを用いて生成した音声は、音声から推定される埋め込みベクトルを用いて生成した音声と比較して、顔画像との親和性、自然性のどちらにおいても同等の結果であることが示されました。 下記プロジェクトページにデモもありますので、ご確認ください。 プロジェクトページ:https://github.com/DeNA/Face2Speech

project member

KOICHIRO MORI AI研究開発エンジニア