O Google disponibilizou recentemente um vídeo que explica como a sua máquina de traduções funciona. Confira detalhes e inovações que o serviço ganhou nos últimos 4 anos e quais os produtos do Google que atualmente utilizam a tecnologia.
O Google explica (Tradução Livre / Google Discovery):
“Google Translate é uma ferramenta gratuita que permite traduzir frases, documentos e até sites inteiros imediatamente. Mas como exatamente ela funciona? Embora possa parecer como se tivéssemos uma sala cheia de elfos bilíngües trabalhando para nós, na verdade todos as nossas traduções vêm de computadores. Estes computadores usam um processo chamado de ‘tradução estatística automática” que é apenas uma maneira extravagante de dizer que nossos computadores geram traduções com base em padrões encontrados em grandes quantidades de texto.
Mas vamos dar um passo atrás. Se você quiser ensinar a alguém uma nova língua, você pode começar ensinando-lhes palavras de vocabulário e regras gramaticais que explicam como construir frases. Um computador pode aprender a língua estrangeira da mesma forma – com referência ao vocabulário e um conjunto de regras. Mas as línguas são complicadas e, como qualquer estudante de línguas pode lhe dizer, existem exceções para quase qualquer regra. Quando você tenta capturar todas essas exceções e exceções às exceções, em um programa de computador, a qualidade da tradução começa a quebrar. O tradutor do Google tem uma abordagem diferente.
Em vez de tentar ensinar os nossos computadores todas as regras de uma língua, deixamos nossos computadores descobrir as regras por si mesmas. Eles fazem isso através da análise de milhões e milhões de documentos que já foram traduzidos por tradutores humanos. Estes textos traduzidos são de livros, organizações como a ONU e sites de todo o mundo. Nossos computadores digitalizam textos procurando padrões estatisticamente significativos – isto é, padrões entre a tradução e o texto original, que é improvável de ocorrer por acaso. Quando o computador encontra um padrão, ele pode usar este padrão para traduzir textos similares no futuro. Quando você repete esse processo bilhões de vezes, você acaba com milhares de milhões de padrões e um programa de computador muito esperto. Para alguns idiomas, porém temos menos traduzido documentos disponíveis e, portanto, os padrões menores para nosso software possa detectar. É por isso que a nossa qualidade da tradução pode variar de idioma e línguas. Sabemos que nossas traduções nem sempre são perfeitas mas estamos sempre fornecendo novos textos traduzidos e ajudando nossos computadores a tornarem mais inteligentes e com melhores traduções. Então da próxima vez que você traduzir uma frase ou página da web com o Google Translate, pense nos milhões de documentos e bilhões de padrões que levou a sua tradução – e tudo isso acontecendo em um piscar de olhos“.