Nota del autor

Si la entrada que estás leyendo carece de imágenes, no se ve el vídeo que teóricamente lleva incrustado o el código fuente mostrado aparece sin formato, podéis conocer los motivos aquí. Poco a poco iré restableciendo la normalidad en el blog.
Este blog es un archivo de los artículos situados previamente en Lobosoft.es y ha dejado de ser actualizado. Las nuevas entradas pueden encontrarse en www.lobosoft.es. Un saludo,
Lobosoft.

lunes, 4 de febrero de 2008

Control de SPAM en Wordpress

SPAM


La publicidad indeseada en Internet es una de las grandes lacras que debemos soportar día a día, los que la usamos, bien por trabajo, bien por placer o necesidad, de una forma intensiva. Comenzaron por los correos indeseados, que a día de hoy ni los mejores filtros consiguen eliminar al 100%, y siguieron con bots/troyanos que escribían en el chat (IRC) o en sistemas de mensajería (Jabber, MSN, ICQ...). Actualmente, no sólo debemos sortear la publicidad en estos medios, sino también en comentarios en foros, listas de distribución de correo, grupos de usuarios y, por último, en los blogs.


Lobosoft es un blog bastante reciente, hasta el momento apenas he podido dedicar tiempo al mismo, pero ya comienza a recibir el asedio de los bots de publicidad. El SPAM ha hecho acto de presencia, y parece dispuesto a quedarse. En apenas unos días, me he visto controlando los comentarios que dejan los lectores del foro, porque no dejan de llegar procedentes de extraños remitentes. Bill.Gates@gmail.com, ha resultado ser el más curioso de ellos. Algunos bots simplemente "leen" el contenido del post diario, extraen algunas frases destacadas a modo de resumen y lo incluyen en su blog, apuntando al mío. Eso ocurrió con el post sobre OpenID y ASP.NET hace unos días. En este caso, por ejemplo, se trataba de un blog que recopilaba todas las entradas que iba encontrando sobre el tema y las mostraba a los usuarios, como si de un lector RSS se tratase. Rodeando la información de publicidad, como la AdSense de Google y algunos videos de dudosa moralidad. Otros comentarios SPAM simplemente apuntan a algún sitio web para que los incautos lectores que quieran ver su procedencia visiten la web de origen y/o queden infectados con algún troyano.


Para minimizar esta avalancha, estuve pensando instalar algún plugin que mostrase un Captcha. Los captchas son sistemas para determinar si lo que tiene delante la máquina es un humano u otra máquina. Generalmente se basan en mostrar una serie de caracteres deformados que un cerebro humano sea capaz de recomponer e identificar, pero un lector OCR (un Reconocedor Óptico de Caracteres) no pueda hacerlo. En torno a esta idea han surgido interesantes alternativas, como Asirra (acrónimo para Animal Species Image Recognition for Restricting Access), el captcha de los gatitos y perritos, tras el que se encuentra investigando Microsoft, o Captcha Mashup, un curioso captcha en el que debemos seleccionar las tres chicas (o chicos) más atractivas... sin tener en cuenta aquello de que sobre gustos no hay nada escrito.


Centrándonos en el caso que nos ocupa, el uso del captcha no me resulta inicialmente apetecible: es poner una traba más a los lectores del blog, aumenta el peso de las páginas descargadas, y puede saltarse con algún OCR avanzado o usando "esclavos humanos". El bot lee nuestro captcha, se lo enseña a un usuario (por ejemplo, en foros donde el usuario quiera escribir), y redirige la respuesta del humano a nuestro sistema. Así pues, ¿qué opción escoger? Estoy probando Askimet, un plugin para Wordpress (y disponible ahora en otros CMS), que se encarga de filtrar el SPAM. Hasta el momento no lo está haciendo nada mal, y según comentan es efectivo en un 95% de los comentarios. Iremos dando cuenta de ello.

No hay comentarios:

Publicar un comentario