O Gmail, serviço de e-mail do Google, acaba de implementar um novo método que resultou em um aumento impressionante de 38% na detecção de spam.
Esse avanço é fruto de uma melhor identificação de texto, o que permite ao Gmail combater com ainda mais eficácia mensagens indesejadas, phishing e conteúdos maliciosos.
Os spammers costumam utilizar técnicas como o uso de caracteres semelhantes a letras reais, caracteres invisíveis e o preenchimento excessivo de palavras-chave para burlar os modelos de classificação de texto do Gmail.
No entanto, o novo método, chamado RETVec (Resilient & Efficient Text Vectorizer), desenvolvido pela equipe de pesquisa do Google, conseguiu superar essas táticas com sucesso.
O RETVec é uma abordagem inovadora que oferece um desempenho de classificação de última geração e reduz significativamente os custos computacionais.
Além disso, é capaz de suportar todos os idiomas e caracteres UTF-8 sem a necessidade de pré-processamento de texto. Essa flexibilidade torna o RETVec ideal para uso em dispositivos móveis, na web e em outros casos de grande escala.
A implementação do RETVec no Gmail demonstrou resultados impressionantes. Além do aumento de 38% na detecção de spam, também houve uma redução de 19,4% na taxa de falsos positivos e uma diminuição de 83% no uso das Unidades de Processamento Tensorial (TPUs).
Essas melhorias foram possíveis graças a um modelo de incorporação de palavras extremamente leve e a uma divisão eficiente do processamento entre o servidor e a TPU.
O Google testou extensivamente o RETVec ao longo do último ano e, comprovando sua eficácia em aplicações de segurança e combate ao abuso, decidiu disponibilizá-lo para uso externo.
Se você deseja aproveitar esse novo método para aprimorar a detecção de spam em seus próprios sistemas ou pesquisas, o Google criou um tutorial para ajudar você a começar.