Contents

O recurso mais recente do Gmail garante menos lixo eletrônico na sua caixa de entrada!

/images/c15533300d1351951ea88ee1aff2187db7e71e097449a6f3c2ea7f54e6b20b22.jpg O novo sistema do Google é ainda mais eficaz na filtragem de spam. © dieryreyes3456/Pixabay

O Google desenvolveu um novo sistema de filtragem chamado RETVec (Resilient & Efficient Text Vectorizer). É" uma das maiores atualizações de defesa dos últimos anos », garante a empresa em uma postagem no blog.

Em muitos casos, as mensagens maliciosas apresentam títulos divergentes quando comparadas com os e-mails convencionais. Para evitar a detecção por filtros de spam, entidades malévolas recorrem frequentemente a técnicas de alteração de caracteres, como homóglifos (que são caracteres indistinguíveis dos símbolos alfabéticos padrão) ou emojis. Embora estas táticas possam parecer óbvias para os observadores humanos, os algoritmos eletrónicos enfrentam maior dificuldade em reconhecê-las. Em um esforço para aumentar a eficácia da filtragem de spam no Gmail, o Google desenvolveu uma solução inovadora que aumenta significativamente a precisão da categorização de e-mails.

Resultados convincentes

RETVec, que opera em uma estrutura de aprendizado de máquina baseada em TensorFlow, emprega uma abordagem inovadora para análise semântica, avaliando semelhanças visuais entre imagens em vez de depender apenas de conteúdo textual. Nos últimos tempos, o Google conduziu extensos testes internos ao longo de um ano para avaliar a praticidade e a eficácia desta metodologia na abordagem dos desafios de segurança e antipersonação, produzindo resultados altamente encorajadores.

Após avaliação, observamos uma melhoria substancial em nosso modelo de classificação de spam do Gmail ao empregar o vetor RE-T5 (RETVec) em vez de utilizar a técnica tradicional de representação de texto. Especificamente, a adoção do RETVec resultou em um aumento de 38% na precisão da detecção de spam em relação à linha de base, ao mesmo tempo em que diminuiu o número de e-mails sinalizados erroneamente em 19,4%. Essas descobertas foram documentadas pela equipe de pesquisa do Google baseada em Mountain View.

/images/396fe415f3c86b0f259862c9439d57d7de0948fc0f30bf656d69472eb59067f7.jpg Ao tornar seu sistema de código aberto, o Google quer combater o spam em larga escala. ©Shutterstock.com

O sistema também reduz custos computacionais

Um benefício adicional deste sistema é a sua capacidade de diminuir significativamente as despesas computacionais e, ao mesmo tempo, acomodar todos os idiomas e conjuntos de caracteres utilizando a codificação UTF-8, sem a necessidade de qualquer processamento prévio de texto. Em contraste com outros modelos que podem ter milhões de parâmetros, o nosso modelo possui apenas 200.000 parâmetros, tornando-o suficientemente leve para funcionar num dispositivo pessoal.

O Google recentemente tornou o RETVec acessível no Gmail, lançando-o como uma ferramenta de código aberto no GitHub, permitindo que outros desenvolvedores o incorporassem como uma solução de classificação de texto.

/images/7cc561e46f16352330e95e4920ef4a986836e8569777db7c3ebeb1de5a97e092.jpg Baixar Leia a crítica 8-Armazenamento de e-mail gratuito e ilimitado -Filtragem avançada de e-mail e pesquisa fácil -Gerenciamento de contatos e calendário integrado à interface

Gmail é uma plataforma de correio eletrônico baseada na Internet fornecida gratuitamente pelo Google, que permite aos usuários transmitir e receber correspondência através da World Wide Web. Além disso, inclui diversas funcionalidades como recuperação de mensagens, organização de contatos e layout personalizado, todas visando melhorar a experiência do usuário.

Gmail é uma plataforma de correio eletrônico baseada na Internet fornecida gratuitamente pelo Google, que permite aos usuários transmitir e receber mensagens remotamente, ao mesmo tempo que oferece diversas funcionalidades, incluindo recursos de pesquisa de e-mails, organização de contatos e opções de layout personalizado.

Fontes: Google, Ars Technica

*️⃣ Link da fonte:

no GitHub , Google , Ars Technica ,