En recientes días se ha sucitado una tormenta de Spam caracterizada por utilizar archivos adjuntos en PDF. Afortunadamente ha surgido una forma de combatir este problema.
PDFassassin es un módulo para
SpamAssassin que permite la revisión de los archivos PDF a través de
text2pdf (poppler-utils o xpdf) y
gocr. El módulo trabaja de la siguiente forma:
- Los cuerpos de los mensajes de correo electrónico son supervisados durante la conección y los adjuntos en PDF son revisados.
- Se extrae el texto desde los PDF a través de pdf2text y éste es supervisado por SpamAssassin
- Si el PDF contiene imágenes, se utiliza gocr para extraer el texto contenido en éstas.
- El total de calificación de Spam de el PDf es comparado contra el límite global especificado en required_score en el archivo pdf.cf; si éste es mayor, se suma a la calificación global del mensaje.
Instalación a continuación.
- Instalar poppler-utils
yum -y install poppler-utils
- Instalar gocr (no incluido en CentOS 5 ni Red Hat Enterprise Linux 5, pero si en AL Desktop)
yum -y install gocr
O bien:
wget http://www.alcancelibre.org/al/el/5/RPMS.al/gocr-0.44-2.9.el5.al.i386.rpm
yum -y localinstall gocr-0.44-2.9.el5.al.i386.rpm
- Descargar el módulo desde http://blog.atmail.com/?p=61
wget http://atmail.com/members/Pdf.tgz
- Descomprimir en /etc/mail/spamassassin/:
tar zxvf Pdf.tgz -C /etc/mail/spamassassin/
- Ajustar la configuración de SpamAssassin:
spamassassin -D --lint
- La salida (que mostrará mucha información) deberá incluir lo siguiente:
dbg: config: read file /etc/mail/spamassassin/pdf.cf
dbg: plugin: fixed relative path: /etc/mail/spamassassin/Pdf.pm
dbg: plugin: loading Pdf from /etc/mail/spamassassin/Pdf.pm
dbg: plugin: registered Pdf=HASH(0x93c2c40)
Tras lo anterior, solo bastará reiniciar los servicios de spamassassin y spamass-milter.
service spamassassin restart
service spamass-milter restart
Los siguientes comentarios son de la persona que los haya enviado. Este sitio no se hace responsable de las opiniones expresadas por los participantes en los foros y secciones de comentarios, y el hecho de publicar las mismas no significa que esté de acuerdo con ellas.
Comments are closed and no new posts are allowed.