Baneando robots abusivos: HMSE_Robot

Autor: Armonth | El sábado 15 de septiembre del 2007 @ 01:51.

HMSE_Robot es un "nuevo" bot de origen coreano que recorre la red en busca de direcciones que recolectar para hacer spam y contenido que plagiar y lucrarse.

No respeta el robots.txt y en poco más de 16 horas ha visitado más de 3000 páginas de SigT cuando antes ni existía en las estadísticas, 3000 páginas es mucho concretamente la mitad de lo que ha leído el GoogleBot en todo lo que va de mes. Es decir: estamos ante todo un señor comedor de ancho de banda ajeno.

El bot se identifica tal cual, con la cadena HMSE_Robot y la IP pertenece a un ISP llamado Hanaro Telecom, Inc. Parece ser que tienen todo el rango 222.239.220.xxx asignado siendo la IP 222.239.220.202 la principal fuente.

Para evitar dicho abuso, los he baneado vía htaccess:

RewriteCond %{REMOTE_ADDR} ^222.239.220.*$ [OR]   
RewriteCond %{HTTP_USER_AGENT} HMSE_Robot   
RewriteRule .? - [F]

Aunque si estuviera en mi propio dedicado, a lo mejor hubiera sido más directo con un:

$IPTABLES -A INPUT -i eth0 -s 222.239.220.0/24 -j DROP

Aunque ahora no recuerdo si IPTables soporta comodines para las IPs, tendré que ir quitando el oxido a esos conocimientos para el día que finalmente me ponga en un dedicado.

Comentarios