O Google desenvolveu um novo software que pode isolar vozes individuais em uma sala lotada.
Os sistemas de reconhecimento de voz encontrados em telefones celulares e assistentes domésticos inteligentes geralmente são inúteis quando mais de uma pessoa fala ao mesmo tempo.
Agora, entretanto, a gigante de Mountain View criou um novo sistema de aprendizagem profunda capaz de isolar vozes individuais mesmo quando várias pessoas estão falando.
A chave está em observar o rosto de cada pessoa para combinar sua voz com seus movimentos faciais. Uma vez que as vozes foram isoladas, cada uma é gravada em uma faixa de áudio separada.
Não está claro no momento como o Google pretende usar essa tecnologia, mas afirma que está atualmente “explorando oportunidades”.
O sistema certamente pode ser inestimável em aplicativos de bate-papo on-line, bem como no isolamento de vozes durante a edição de vídeo.
Aparelhos auditivos também poderiam ser melhorados para isolar uma pessoa específica falando em uma sala, no entanto, este método também poderia tornar mais fácil para alguém ouvir uma conversa particular.
Uma demonstração do sistema em ação pode ser vista abaixo:
1 comment
Agora vai ficar mais fácil identificar a voz e oferecer propaganda.