Extender Webalizer y agrupar de forma inteligente los referidos

Autor: Armonth | El domingo 10 de septiembre del 2006 @ 22:13.

Uno se está dando cuenta que existen muchas maneras de utilizar las estadísticas y según dicen del saber usarlas bien depende obtener el éxito (en el caso de lo que busques sea eso). El software que yo uso para las estadísticas en SigT es el Webalizer del cual ya hablé en Parcheando Webalizer para mejorarlo y "Fichero de configuración de Webalizer.

Voy a comentar los últimos cambios que he hecho, primero de nada he eliminado los TOPs innecesarios quedando esa parte del fichero como sigue a continuación:

TopKURLs        40
TopAgents       50
TopReferrers    60
TopSites        0
TopKSites       0
TopCountries    0
TopExit         0
TopUsers        0
TopSearch       60
TopEntry        25

AllReferrers   yes
AllSearchStr   yes

La principal novedad son las dos últimas líneas que crean sendos ficheros con todas las referencias y todas las palabras clave desde donde llegan los lectores que usan buscadores. La idea es que si usamos Technorati entre éste y los trackbacks podemos saber de forma bastante acertada quién y cuándo nos enlaza. Entonces pregunto: ¿Por qué tener miles de líneas en los referidos? Lo habitual en estos casos es agrupar los que coinciden, por ejemplo si nos llegan 100 accesos desde www.google.com/search y 50 más desde google.es/search los agrupamos para que nos de un porcentaje total.

Pero es más interesante ampliarlo y agrupar los sitios que habitualmente nos enlazan y por tanto nos muestran muchos referidos, por ejemplo he recibido bastantes referidos desde del.icio.us, cientos de líneas de pocas visitas cada una de gente que me añade a del.icio.us, entonces es mejor agruparlos y saber en conjunto cuánto tráfico nos reporta del total.

Al final, los sitios que generan más tráfico, referencias y que nos enlazan a menudo son agrupados para limpiar la lista de referidos y poder fijarnos más en las nuevas fuentes de entrada como por ejemplo blogs que recién empiezan y tienen pocas visitas pero contenido interesante. También ayuda a ampliar mis fuentes.

Por no decir que es bastante molesto ver cientos de referidos desde distintas IPs y Google's: Para ver que he recibido 1 visita desde Google Japón prefiero que me lo ponga de forma génerica como "Google". ¿Cómo se agrupan los referidos en Webalizer? pues con GroupReferrer y HideReferrer, a continuación una buena lista para ocultar referidos habituales en blogs, principalmente Google Search, sus datacenters (IPs), buscadores, del.icio.us y Technorati recolectados en el último mes:

# Referidos "inútiles" (bloqueadores, etc)
HideReferrer    XXXX:+++++++++++++

# Google::Datacenters (buscador desde IPs)
GroupReferrer   66.102.7.104/search       Google Datacenters
GroupReferrer   66.102.9.104/search       Google Datacenters
GroupReferrer   64.233.161.104/search     Google Datacenters
GroupReferrer   64.233.167.104/search     Google Datacenters
GroupReferrer   64.233.179.99/search      Google Datacenters
GroupReferrer   64.233.179.104/search     Google Datacenters
GroupReferrer   64.233.183.104/search     Google Datacenters
GroupReferrer   64.233.187.104/search     Google Datacenters
GroupReferrer   66.249.93.104/search      Google Datacenters
GroupReferrer   72.14.203.104/search      Google Datacenters
GroupReferrer   72.14.207.104/search      Google Datacenters
GroupReferrer   72.14.209.104/search      Google Datacenters
GroupReferrer   72.14.221.104/search      Google Datacenters
GroupReferrer   216.239.37.104/search     Google Datacenters
GroupReferrer   216.239.39.104/search     Google Datacenters
GroupReferrer   216.239.51.104/search     Google Datacenters
GroupReferrer   216.239.57.104/search     Google Datacenters
GroupReferrer   216.239.59.104/search     Google Datacenters
GroupReferrer   216.239.63.104/search     Google Datacenters
HideReferrer    66.102.7.104/search
HideReferrer    66.102.9.104/search
HideReferrer    64.233.161.104/search
HideReferrer    64.233.167.104/search
HideReferrer    64.233.179.99/search
HideReferrer    64.233.179.104/search
HideReferrer    64.233.183.104/search
HideReferrer    64.233.187.104/search
HideReferrer    66.249.93.104/search
HideReferrer    72.14.203.104/search
HideReferrer    72.14.207.104/search
HideReferrer    72.14.221.104/search
HideReferrer    72.14.209.104/search
HideReferrer    216.239.37.104/search
HideReferrer    216.239.39.104/search
HideReferrer    216.239.51.104/search
HideReferrer    216.239.57.104/search
HideReferrer    216.239.59.104/search
HideReferrer    216.239.63.104/search

# Google::Search (solamente los principales)
GroupReferrer   www.google.com/search           Google
GroupReferrer   www.google.es/search            Google
GroupReferrer   www.google.ca/search            Google
GroupReferrer   www.google.cl/search            Google
GroupReferrer   www.google.com.co/search        Google
GroupReferrer   www.google.com.ar/search        Google
GroupReferrer   www.google.com.mx/search        Google
GroupReferrer   www.google.de/search            Google
GroupReferrer   www.google.fr/search            Google
GroupReferrer   www.google.it/search            Google
GroupReferrer   www.google.jp/search            Google
HideReferrer    www.google.com/search
HideReferrer    www.google.es/search
HideReferrer    www.google.ca/search
HideReferrer    www.google.cl/search
HideReferrer    www.google.com.co/search
HideReferrer    www.google.com.ar/search
HideReferrer    www.google.com.mx/search
HideReferrer    www.google.de/search
HideReferrer    www.google.fr/search
HideReferrer    www.google.it/search
HideReferrer    www.google.jp/search

# Google::Images (imagenes, solamente desde donde recibo :P)
GroupReferrer   images.google.es                Google Images
GroupReferrer   images.google.cl                Google Images
GroupReferrer   images.google.fr                Google Images
GroupReferrer   images.google.de                Google Images
GroupReferrer   images.google.it                Google Images
GroupReferrer   images.google.co.ve             Google Images
GroupReferrer   images.google.co.id             Google Images
GroupReferrer   images.google.ca                Google Images
GroupReferrer   images.google.co.hu             Google Images
GroupReferrer   images.google.cz                Google Images
GroupReferrer   images.google.se                Google Images
GroupReferrer   images.google.bg                Google Images
GroupReferrer   images.google.co.cr             Google Images
GroupReferrer   images.google.co.in             Google Images
GroupReferrer   images.google.co.jp             Google Images
GroupReferrer   images.google.fi                Google Images
GroupReferrer   images.google.lt                Google Images
GroupReferrer   images.google.at                Google Images
HideReferrer    images.google.es
HideReferrer    images.google.cl
HideReferrer    images.google.fr
HideReferrer    images.google.de
HideReferrer    images.google.it
HideReferrer    images.google.co.ve
HideReferrer    images.google.co.id
HideReferrer    images.google.ca
HideReferrer    images.google.co.hu
HideReferrer    images.google.cz
HideReferrer    images.google.se
HideReferrer    images.google.bg
HideReferrer    images.google.co.cr
HideReferrer    images.google.co.in
HideReferrer    images.google.co.jp
HideReferrer    images.google.fi
HideReferrer    images.google.lt
HideReferrer    images.google.at

# Google::Translation Tools (traductor online)
GroupReferrer   google.com/translate            Google Translation
GroupReferrer   64.233.179.104/translate_c      Google Translation
GroupReferrer   216.239.37.104/translate_c      Google Translation
GroupReferrer   216.239.39.104/translate_c      Google Translation
HideReferrer    google.com/translate
HideReferrer    64.233.179.104/translate_c
HideReferrer    216.239.37.104/translate_c
HideReferrer    216.239.39.104/translate_c

# Otros motores de busqueda
GroupReferrer   technorati.com          Technorati
HideReferrer    technorati.com

GroupReferrer   alltheweb.com           AllTheWeb
HideReferrer    alltheweb.com

GroupReferrer   ask.com                 Ask.com
HideReferrer    ask.com

GroupReferrer   altavista.com           Altavista
HideReferrer    altavista.com

GroupReferrer   yahoo.                  Yahoo!
HideReferrer    yahoo.

GroupReferrer   search.msn.com          MSN Search
HideReferrer    search.msn.com

# Otros
GroupReferrer   meneame.net                     Menéame
HideReferrer    meneame.net
GroupReferrer   del.icio.us                     Del.icio.us
HideReferrer    del.icio.us

Por último decir que mediante este método he encontrado bastantes entradas interesantes que he ido enlazado en las listas de enlaces (siglinks) o en entradas más especificas, por lo que se puede deducir que cuanto más me enlazan más nuevos blogs conozco (a los cuales les hecho un vistazo) y más nuevos blogs enlazo.

Comentarios