In questo articolo descriverò gli step necessari a installare e configurare FuzzyOCR su Debian Wheezy affinché le email in transito sul nostro server vengano analizzate alla ricerca di immagini SPAM.
FuzzyOCR non è altro che un plugin per SpamAssassin il quale analizza le email e in particular modo le immagini contenute nel corpo delle stesse.
Cosa c’è nel cofano?! (What is all this about?)
Grazie all’utilizzo di varie metodologie vengono analizzate le immagini contenute nelle email in transito. Se SpamAssassin reputa una email pulita, le immagini passano a FuzzyOCR, altrimenti se la email è già segnalata come spam il controllo da parte dello scanner di immagini non viene effettuato. In questo modo il carico di lavoro sul server si riduce di molto in quanto si elimina parecchio lavoro inutile.
Verificate che il vostro sistema sia aggiornato! (se non lo fosse… beh questo è il momento di farlo!!!)
ABILITIAMO FUZZYOCR
Installiamo ciò che è necessario
apt-get install netpbm gocr giflib-tools libpng3 libgif4 gifsicle ocrad libstring-approx-perl libmldbm-perl libmldbm-sync-perl liblog-agent-perl libpng12-dev libtiff4-dev libsvga1-dev libx11-dev tesseract apt-get install fuzzyocr
Diamo uno sguardo al nostro file di configurazione
vi /etc/mail/spamassassin/FuzzyOcr.cf
Verificate che le seguenti direttive siano attivate e che siano similia queste. A ogni buon conto vi lascio il mio file di configurazione per i confronti del caso con il vostro.
focr_enable_image_hashing 2 focr_db_hash /etc/mail/spamassassin/FuzzyOcr.db focr_db_safe /etc/mail/spamassassin/FuzzyOcr.safe.db focr_db_max_days 15
APPLICHIAMO E TESTIAMO LE MODIFICHE
È arrivato il momento di riavviare il nostro servizio, a patto che il demone di SpamAssassin sia attivo (in alcune circostanze SpamAssassin è chiamato ad eseguire il proprio compito da AMaViS caso per cui non serve riavviare nulla)
/etc/init.d/spamassassin restart
Testiamo ora il funzionamento del nostro plugin
spamassassin --debug FuzzyOcr < /usr/share/doc/fuzzyocr/examples/ocr-animated.eml >/dev/null
Per controllare il funzionamento “live” del sistema possiamo anche ricorrere al seguente comando
spamassassin -D