Inteligência artificial do Google desenvolve síntese de voz humana

Cientistas do Google DeepMind estão desenvolvendo uma síntese de voz, um processo que permite a produção artificial de voz humana, por meio do uso da tecnologia de inteligência artificial.

Enquanto as máquinas hoje conseguem escutar a voz humana de uma forma avançada, as respostas fornecidas pelo Google e outras empresas ainda apresentam falhas perceptíveis que podem ser notadas como “robóticas”.


Atualmente a “voz” das máquinas se baseia em fragmentos de dados que combinadas são capazes de formar palavras. Entretanto, essa união pode apresentar sonoridades desiguais e inflexões estranhas.

DeepMind
Cada ponto é uma amostra analisada separadamente; o agregado é a forma de onda digital.

Para corrigir esse problema, a DeepMind pretende simular o som de 16.000 amostras por segundo com um nível profundo de análise capaz de construir o som a partir de zero.

A abordagem da WaveNet significa que o Google poderia gerar qualquer tipo de fala ou até mesmo música. Você pode ouvir abaixo da qualidade desta nova síntese de voz:

Comente!