抱えていた課題・目的
ユーザー参加型の、より親しみやすい独自IPの創出。
目標とする声色の再現性と高速な音声変換の両立が困難だった。
実現した結果
従来難しかった誰の声からでもキャラクターの声へ高速変換する技術を実現。
エンターテインメントとAI技術の融合により、新しいユーザー体験を生み出した。
社内公募プロジェクトから始まったプロジェクト。
音声変換技術を融合させたオリジナルIPの開発をしました。ユーザーが10秒間話した声を短時間で音声変換し、七声ニーナの声として出力します。
テクノロジーとエンターテインメントの融合
プロトタイプであることを象徴する、ある意味不完全なキャラクターは、まだ保証しきれない品質への補完、つまり今後進化していくということを意味します。
そのために感情表現の高さの幅を小さくして、プロトタイプ要素+ロボット要素をデザインに落とし込んでいます。
七声ニーナのキャラクターボイスは声優の高田憂希さんの声を採用しました。
音声変換のステップでは、ユーザーのアクションに応じてキャラクターとのコミュニケーションが変化する仕掛けを取り入れ、ナラティブなUXを叶えました。
それにより、ユーザーに「待たされている」「作業している」という感覚を与えないようにしました。
突然のトラフィックにも耐えうる開発環境
サーバーサイドのシステムはGoogle Cloudに設置。
一般的なWebサービスに比べて演算コストが高く、またトラフィックが集中するとユーザー体験が大きく損なわれる可能性があるサービスのため、突発的にアクセスが集中しても高速に応答できるよう、その時々で処理能力が自動調整できる設計を実現しました。
音声サンプルの機械学習と最新の音声変換技術
アウトプットされる七声ニーナの声となる声優の声と、サンプルとなる数多くの男女の声を録音。
コストやリードタイムを抑えつつ、最新の音声技術を用い、一連の動作を一般的なCPUで高速処理が可能なシステムに仕上げました。