Google Assistant、音声生成技術「WaveNet」によりさらに自然な日本語に

Android Policeは9日(現地時間)、米グーグルのバーチャルアシスタント「Google Assistant」に同社傘下の米DeepMindによって開発された最新の音声生成アルゴリズム「WaveNet」が採用されていることが、公式に発表されたことを伝えています。

WaveNet自体は既に昨年発表されていましたが、DeepMindによると、この1年間をかけて改良を重ねた結果、音声生成処理を実に1000倍も高速化することに成功し、発表時点では0.02秒分の音声を生成するのに1秒かかっていたところを、1秒で20秒分の音声を生成することが可能になったとのことです。

また、WaveNetが採用する機械学習による音声生成技術は処理速度のみならず、精度の面においても進化を遂げており、非常に自然な抑揚とイントネーションを実現しています。公開されているサンプル音源を聞けば、その差は一目瞭然です。

「WaveNet」導入前(上)と導入後(下)

一聴してWaveNetが導入されたバージョンのGoogle Assistantの方が、より実際の人間に近い発音を実現していることが分かります。

なお、現時点でWaveNetは、米語(アメリカ英語)および日本語の2ヶ国語のみの対応となっていますが、今後対応言語は追加されていく見通しです。

[DeepMind via Android Police]

このニュースでディスカッション
  • コメントを投稿する際には「コメントガイドライン」を必ずご覧ください
  • コメントを投稿した際には、コメント機能利用規約(ガイドライン)に同意したものとみなされます
  • 主要ニュースサイトなどの「許可サイト」以外のURLを含む投稿はコメントが保留されます