Solução conta com mais de 32 vozes em 12 idiomas diferentes, inclusive português.
O Google Cloud anunciou nesta quarta-feira (28/3) a inclusão da ferramenta de text-to-sppech a seu portfólio de produtos baseados em inteligência artificial. A solução permite a clientes a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português.
É a primeira vez que a empresa disponibiliza o WaveNet, um produto de pesquisa de síntese de voz da DeepMind, para o público.
Dan Aharon, gerente de produto de Google Cloud AI, comenta que muitos produtos da gigante, como Google Assistant, Search e Maps, vêm com uma síntese de texto para fala incorporada, de alta qualidade, que produz fala com som natural. “Os desenvolvedores nos disseram que gostariam de adicionar texto para voz a seus próprios aplicativos. Por isso, hoje estamos trazendo essa tecnologia para o Google Cloud Platform, com o Cloud Text-to-Speech”, diz.
Além de permitir que os usuários escolham entre vozes e idiomas diferentes, o Cloud Text-to-Speech também traz pronúncias mais eficazes em textos complexos, como nomes, datas, horários e endereços.
O produto, já utilizado por empresas como Cisco e Dolphin ONE, permite a personalização do tom, a taxa de fala e o ganho de volume da voz, além de oferecer suporte a diversos formatos de áudio, incluindo MP3 e WAV.