Cientistas do Google DeepMind estão desenvolvendo uma síntese de voz, um processo que permite a produção artificial de voz humana, por meio do uso da tecnologia de inteligência artificial.
Enquanto as máquinas hoje conseguem escutar a voz humana de uma forma avançada, as respostas fornecidas pelo Google e outras empresas ainda apresentam falhas perceptíveis que podem ser notadas como “robóticas”.
Atualmente a “voz” das máquinas se baseia em fragmentos de dados que combinadas são capazes de formar palavras. Entretanto, essa união pode apresentar sonoridades desiguais e inflexões estranhas.
Para corrigir esse problema, a DeepMind pretende simular o som de 16.000 amostras por segundo com um nível profundo de análise capaz de construir o som a partir de zero.
A abordagem da WaveNet significa que o Google poderia gerar qualquer tipo de fala ou até mesmo música. Você pode ouvir abaixo da qualidade desta nova síntese de voz: