O Google está trabalhando em um modelo de linguagem de inteligência artificial (IA) que suporta mil idiomas diferentes.
A empresa compartilhou informações sobre o Universal Speech Model (USM), um sistema que é considerado um “primeiro passo crítico” para atingir esse objetivo.
O USM é uma família de modelos de fala com 2 bilhões de parâmetros treinados em 12 milhões de horas de fala e 28 bilhões de frases em mais de 300 idiomas.
Ele suporta a detecção automática e tradução de mais de 100 idiomas, incluindo inglês, mandarim, amárico, cebuano, assamês, entre outros. O YouTube já usa o USM para gerar legendas automáticas.
O objetivo do Google é criar um modelo de linguagem que suporte 1.000 dos idiomas mais falados do mundo. Os avanços da tecnologia podem levar a usos incríveis, como óculos de realidade aumentada capazes de detectar e fornecer traduções em tempo real que aparecem diante de seus olhos.
No entanto, a tecnologia ainda está em desenvolvimento e é importante lembrar que erros podem ocorrer, como o Google mostrou durante o I/O do ano passado, ao apresentar uma versão errada da língua árabe.
O desenvolvimento de modelos de linguagem como o USM é um passo importante para democratizar o acesso à informação em todo o mundo e para promover a inclusão digital.
Ainda há muito trabalho a ser feito para alcançar esse objetivo, mas a IA continua a avançar em direção a uma maior compreensão e processamento de idiomas diversos.