こんにちは sakasai です。
AWSのAIサービスの1つで、テキストから音声を生成(TTS: text-to-speech)することができるAmazon Pollyに2つの新しい日本語NTTS音声が追加されました。
https://aws.amazon.com/jp/about-aws/whats-new/2023/02/amazon-polly-two-japanese-ntts-voices/
NTTS(Neural TTS)はTTSをさらに人間に似た音声にする技術です。
Amazon PollyではスタンダードなTTSとNTTSのどちらかを選択して音声を生成することができるのですが、今回NTTSに新しい日本語の音声が追加されました。
これにより、NTTSで3種類、TTSで2種類の日本語音声が選択できるようになりました。
NTTSで選択できる音声
- Kazuha (NEW)
- Tomoko (NEW)
- Takumi
TTSで選択できる音声
- Mizuki
- Takumi
これまで日本語NTTSが男性音声のTakumiだけでしたが、今後は女性音声のNTTSを利用できるようになりました。
というわけでどんな感じか早速聞いてみましょう。
弊社採用サイトの下記テキストをそれぞれ読んでもらいました。
ディーメイクは2015 年に設立した、まだまだ歴史の浅い会社です。
https://www.d-make.co.jp/recruit/service/index.html
だからこそ、柔軟な発想と行動力でさまざまな変化を生み出せる環境にあります。
変化が激しい時代だからこそ、変化ができたものが価値を出せる時代であるともいえます。
弊社はよりエンジニアが存分に力を発揮できる環境作りとエンジニアの適切な評価を価値として出していける会社を目指しています。
追加されたNTTSが女性の2種類なので、新しいNTTSのKazuha、TomokoとTTSのMizukiの3種類を聴き比べてみたいと思います。
まずはスタンダードTTSのMizukiさん
次にNTTSのKazuhaさんとTomokoさん
いかがでしょうか。
今回読んでもらったテキストだと違いが分かりづらかったかもしれませんが、たしかにNTTSはより人間に近い自然な感じかなと思いました。
というわけで、Amazon Pollyに新しく追加されたNTTSの音声を聞いてみました。
選択肢が増えたことによって、サービスなどでも色々使い分けたりなど利用用途が増えて便利になったかと思います。
皆さんも色々試してみてはいかがでしょうか。