High Scability sigue haciendo un buen trabajo con sus entradas con información de las arquitecturas usadas en servicios populares. Ahora le toca el turno a Flickr y a TypePad. El segundo pese a ser uno de los servicios más populares como plataforma de "blogging" de pago no lo voy a comentar: es más interesante el caso de Flickr ya que su principal carga de tráfico son imágenes.
Flickr se mueve en el clásico LAMP pero usando PHP y Perl, Linux RedHat, Java, etcétera. Llama la atención Squid, uno de los proxys GPL más populares usado como un proxy invertido para el HTML y las imágenes.
Las estadísticas de Flickr son simplemente bestiales:
- Más de 4 mil millones (4 billones anglosajones) de peticiones diarias.
- Alrededor de 35 millones de fotos en la cache de Squid (total).
- Alrededor de 2 millones de fotos en la RAM de squid (¿?).
- Alrededor de 470 millones de fotos, 4 o 5 tamaños de cada una.
- 38.000 peticiones por segundo a memcached (12 millones de objectos cacheados).
- 2 "PB" (supongo que petabytes) para almacenamiento (consume cerca de 1.5 terabytes un domingo).
- Más de 400.000 fotos son añadidas cada día.
Todo se guarda en base de datos excepto las fotos. Hay muchos puntos interesantes (realmente el artículo es extenso) pero prefiero que si alguien se anima que lo traduzca y quedarme con una conclusión: la cantidad apabullante de software libre que se usa en los servicios altamente populares.
Esta claro que, al menos en estos servicios web, las licencias no parecen ser la cuestión importante si no la capacidad de adaptar el software a las necesidades de cada uno. No en vano en servidores web se presupone acceso a un LAMP con software libre y no a un WIAS (Windows - IIS - ASP.net - SQL server, que por cierto que acrónimo más feo me acabo de sacar de la manga).
Comentarios