O YouTube informou esta semana que irá integrar uma nova funcionalidade automática para a geração de legendas em vídeos. De acordo com o Google, a ferramenta utiliza uma tecnologia existente no Google Voice para reconhecimento de voz.
“Nós estamos combinando nossa tecnologia de sistema de reconhecimento de voz (ASR) com a o sistema de legendas do YouTube para oferecer legendas automáticas. O “auto-caps” utiliza os mesmos algoritmos de reconhecimento encontrados no Google Voice para gerar legendas automaticamente” disse a empresa.
Entretanto, o novo recurso está apenas disponível para os vídeos em inglês e um pequeno número de canais que abordam conversas e entrevistas: UC Berkeley, Stanford, MIT, Yale, UCLA, Duke,UCTV, Columbia, PBS e National Geographic.
Auto-Timing
Outra funcionalidade também implementada está o “auto-timing”, que permite enviar a transcrição de um vídeo e obter automaticamente os códigos de tempo. “Tudo que você precisa é criar um arquivo de texto com todas as palavras que estão no vídeo e nós utilizaremos a tecnologia do Google ASR para montar os momentos quando as palavras são citadas, e criar assim a legenda para seu vídeo.”
5 comments
Legal! =)
Google inovando como sempre o/
Incrível como o Google trabalha, com a opção de enviar sua própria transcrição eles aumentam a base de conhecimento sobre transcrição, podem criar algoritmos que aprendam com as transcrições que as pessoas enviam. Sem falar que esse esquema de transcrição é uma mega jogada para alimentar ainda mais o índice das buscas. Fenomenal…
Pois é, Éverton. A visão sistêmica do Google parece visar sinergia entre seus aplicativos e usuários… Com o texto associado ao vídeo é possível fazer buscas melhores e destacar na barra de progresso do vídeo os trechos onde as palavras da busca são citadas (como já fazem em alguns). Agora, como melhorar o sistema de transcrição? Com os usuários treinando o sistema, como vc apontou. Agora, pq usuários fariam isso? Como exemplo, para surdos lerem e pessoas de outros países acompanharem melhor lendo. Mas acredito que a grande maioria será produzida por aqueles que fazem traduções para legendar vídeos em sua língua, com isso basta usar os tradutores automáticos do próprio Google para aproveitar essas entradas e melhorar a indexação dos vídeos para as diversas línguas e na comparação entre elas realimentar/treinar a própria base do sistema de tradução… Mas isso pode ser só minha imaginação… =)
@Witaro
Isso para não citar a integração que pode ocorrer com o recurso “Google Audio Indexing” (in Labs):
http://labs.google.com/gaudi