Nova tecnologia do Gmail aumenta em 38% a detecção de spam

O Gmail, serviço de e-mail do Google, acaba de implementar um novo método que resultou em um aumento impressionante de 38% na detecção de spam.

Esse avanço é fruto de uma melhor identificação de texto, o que permite ao Gmail combater com ainda mais eficácia mensagens indesejadas, phishing e conteúdos maliciosos.

Os spammers costumam utilizar técnicas como o uso de caracteres semelhantes a letras reais, caracteres invisíveis e o preenchimento excessivo de palavras-chave para burlar os modelos de classificação de texto do Gmail.

No entanto, o novo método, chamado RETVec (Resilient & Efficient Text Vectorizer), desenvolvido pela equipe de pesquisa do Google, conseguiu superar essas táticas com sucesso.

O RETVec é uma abordagem inovadora que oferece um desempenho de classificação de última geração e reduz significativamente os custos computacionais.

Além disso, é capaz de suportar todos os idiomas e caracteres UTF-8 sem a necessidade de pré-processamento de texto. Essa flexibilidade torna o RETVec ideal para uso em dispositivos móveis, na web e em outros casos de grande escala.

A implementação do RETVec no Gmail demonstrou resultados impressionantes. Além do aumento de 38% na detecção de spam, também houve uma redução de 19,4% na taxa de falsos positivos e uma diminuição de 83% no uso das Unidades de Processamento Tensorial (TPUs).

Essas melhorias foram possíveis graças a um modelo de incorporação de palavras extremamente leve e a uma divisão eficiente do processamento entre o servidor e a TPU.

O Google testou extensivamente o RETVec ao longo do último ano e, comprovando sua eficácia em aplicações de segurança e combate ao abuso, decidiu disponibilizá-lo para uso externo.

Se você deseja aproveitar esse novo método para aprimorar a detecção de spam em seus próprios sistemas ou pesquisas, o Google criou um tutorial para ajudar você a começar.