giovedì, Maggio 9, 2024

Il nuovo filtro antispam di Gmail è potentissimo

Il rilevamento dello spam in Gmail dovrebbe migliorare grazie a un aggiornamento del back-end per l’identificazione del testo su alcuni servizi Google. Grazie all’aggiornamento della Sicurezza, Google afferma che Gmail ora è migliore del 38% nel rilevare lo spam.

L’azienda ha annunciato recentemente l’aggiornamento in un messaggio di sicurezza di Google post sul blog. Prima di ciò, è stato testato internamente da Google nell’ultimo anno. Rappresenta il “più grande potenziamento della difesa degli ultimi anni”, afferma la società.

La nuova aggiunta al rilevamento dello spam di Gmail è RETVec, che sta per Resilient & Efficient Text Vectorizer. I vettorizzatori di testo vengono utilizzati per identificare il contenuto di un’e-mail, che a volte viene nascosto dal mittente. Manipolazione di lettere e simboli, utilizzo di omoglifi (caratteri diversi che appaiono simili), aggiunta di caratteri invisibili e utilizzo di parole chiave per cercare di aggirare i filtri antispam.

“RETVec ottiene questi miglioramenti sfoggiando un modello di incorporamento di parole molto leggero (~ 200.000 parametri)”, ha affermato Google nel post. “Ci permette di ridurre le dimensioni del modello Transformer con prestazioni uguali o migliori e di avere la possibilità di suddividere il calcolo tra host e TPU in modo efficiente in termini di rete e memoria.”

Il vantaggio più grande di RETVec è che è migliore del 38% nel rilevamento dello spam, ma ci sono anche molti altri miglioramenti. Questo miglioramento della precisione include una riduzione dei falsi positivi di quasi il 20% e dei falsi negativi di quasi il 18%. I falsi negativi si verificano quando il rilevatore di spam di Gmail non riesce a filtrare un’e-mail di spam come spam, mentre i falsi positivi si verificano quando le e-mail valide vengono erroneamente ordinate come spam.

Poiché Google è riuscita a ridurre le dimensioni del modello Transformer, l’utilizzo di RETVec ha ridotto l’utilizzo dell’unità di elaborazione Tensor dell’83%. Si tratta di un notevole vantaggio in termini di efficienza derivante dall’utilizzo di questo nuovo vettorizzatore di testo in Gmail.

RETVec è stato sviluppato da Google Research ed è interamente open source. Dopo un lungo periodo di test interno di Google, la società ha ritenuto che fosse “altamente efficace per le applicazioni di sicurezza e antiabuso”.

Le persone che desiderano utilizzare RETVec per le proprie applicazioni possono seguire a Tutorial da Google che spiega come iniziare.

ARTICOLI COLLEGATI:

ULTIMI ARTICOLI: