lunes, 4 de octubre de 2021

Por que ocurrió la caída de WhatsApp, Facebook e Instagram?

Tras un fuerte apagón global, los tres servicios empiezan a recuperarse lentamente y de manera desigual, según ha confirmado un portavoz de la compañía
Imagen: TC Televisión 

Fuente: El País 
Facebook, Instagram y WhatsApp han sufrido este lunes la peor caída total de su historia reciente, que ha afectado a sus servicios de forma global, según ha reconocido la compañía en varios mensajes en la red social Twitter. Al contrario que en otras ocasiones, esta vez el servicio estuvo completamente inaccesible. Pasada la medianoche (hora peninsular española y 17.30, hora de México) los tres servicios empezaban aparentemente a recuperarse, lentamente y de manera desigual. Unos minutos después, Andy Stone, responsable de la comunicación oficial de la empresa confirmaba en Twitter que los servicios y aplicaciones de la compañía estaban volviendo a ser accesibles. “Gracias por soportarnos”, concluía su mensaje.

A falta de mayores detalles, expertos externos a Facebook que analizan el tráfico de internet creen que el fallo se debe a problemas del sistema de asignación de dominios (DNS), también conocido como “listín telefónico de internet”: es lo que traduce el nombre que escribimos en el navegador a una dirección de números donde está el servidor en este caso de Facebook. Aunque el problema no es únicamente que el tráfico no sabe a qué dirección ir porque no tiene acceso al DNS, sino que tampoco sabe qué camino tomar hacia allí. No es solo por tanto que hayan borrado el destino, sino que habrían quemado el mapa. Esa ruta de navegación está gestionada por un oscuro protocolo llamado BGP (Border Gateway Protocol o “puerta de enlace frontera”), cuyos detalles de funcionamiento son a menudo desconocidos incluso para informáticos y era este lunes objeto de vivo debate entre ingenieros.

La complejidad de este aparente problema, quizá causado por un error humano aunque desde fuera es difícil descartar otras hipótesis, hace que los expertos vean posible el tiempo tan largo que Facebook se está tomando para arreglarlo. El reto puede conllevar visitas a centros de datos de la compañía. El New York Times informa que ni siquiera en Facebook tienen completamente definido el origen central del problema ni su solución. La caída además afecta a toda la compañía, desde herramientas de comunicación internas a los pases electrónicos para entrar en salas. Adam Mosseri, jefe de Instagram, ha equiparado en Twitter la actividad en la empresa a “un día de nevada”.
Los problemas coinciden con unas semanas muy complicadas para Facebook. A las exclusivas sobre documentos internos de la compañía que ha ido revelando The Wall Street Journal se ha unido este domingo la salida a la luz de la “garganta profunda”, Frances Haugen, que proporcionó esa información al periódico. Haugen, ingeniera informática de Iowa de 37 años y empleada de Facebook entre 2019 y 2021, declaró su identidad este domingo por la noche en un programa de máxima audiencia de la cadena CBS, donde dijo que la compañía priorizaba siempre la búsqueda de beneficios por encima del interés del público. La coincidencia de la caída con las revelaciones de la exempleada han provocado este lunes una caída del 4,9% en las acciones de Facebook. De cara a este martes, la situación puede empeorar.

Haugen declara este martes declara en el Congreso de EE UU sobre su experiencia. Si se alargan los problemas de los servicios de la compañía hasta su comparecencia, el ambiente para Facebook puede ser irrespirable. “Había constantes conflictos de interés entre lo que es bueno para el público y lo que es bueno para Facebook”, dijo Haugen en su entrevista con la CBS. “Facebook siempre escogía optimizar su propio interés, ganar más dinero”, aseguró. La caída del servicio y la irrupción en escena de Haugen, cuya documentación puede hacer su testimonio potencialmente más peligroso para la empresa que Cambridge Analytica.

La caída de Facebook este lunes han comenzado poco antes de las seis de la tarde, hora peninsular española, en torno a las doce del mediodía en Washington, y han impedido por completo el funcionamiento de las tres aplicaciones: no se podía actualizar la información ni enviar o recibir mensajes. Downdetector, página que registra los comentarios de los usuarios cuando falla alguna plataforma en internet, ha recogido desde la caída decenas de miles de quejas procedentes de al menos 45 países.

John Graham-Cumming, jefe de Tecnología de Cloudflare, una célebre empresa de servidores en la nube, ha detectado hacia las 17.50 (hora española) cómo Facebook desaparecía de internet: cuando alguien escribe facebook.com en su navegador. Ese tráfico de usuarios pidiendo cargar un servicio de Facebook no desaparece de golpe sino que siguen preguntando dónde ir y generan un efecto dominó que puede generar problemas de en otras páginas.

EL PAÍS ha consultado a dos especialistas que, sin tener lógicamente toda la información, especulan que es perfectamente plausible que haya sido un error humano que ha provocado la desconexión de Facebook, pero coinciden en que, sin más detalles, es difícil concretar. Es probable que la restauración del servicio necesite del acceso de ingenieros de la empresa a centros de datos, lo que alarga el proceso de subsanación al no ser factible la reparación remota.

Oculus, los servicios de realidad virtual de Facebook también se han visto afectados por la caída. Que una aplicación falle es normal, pero que fallen varias interconectadas con la mayor red social del mundo sí es raro, aunque Facebook ha estado trabajando durante años en la integración de sus sistemas con los de WhatsApp e Instagram. Dos miembros del equipo de seguridad de Facebook han contado a The New York Times que es poco probable que un ciberataque haya causado el apagón precisamente porque la tecnología de cada aplicación es demasiado distinta como para verse afectada por un mismo ataque.
Un sistema vulnerable

El pasado 22 de julio, un fallo en los servicios de la compañía estadounidense de servicios en la nube Akamai provocó interrupciones en el servicio de compañías como Airbnb, plataformas de videojuegos como Playstation Network o Steam, aerolíneas como Delta Air Lines, cadenas de distribución como Costco Wholesale y servicios financieros como American Express, además de numerosos bancos como BBVA o medios de comunicación como EL PAÍS, entre otros.

Más aparatoso fue el fallo global en la red de distribución de contenidos Fastly que el 8 de junio dejó fuera de juego a miles de páginas de todo el mundo. Sitios como los de Amazon, EL PAÍS, The New York Times, Twitch, Financial Times o Reddit sufrieron problemas y en algunos casos permanecieron inaccesibles para sus usuarios durante casi una hora. Al día siguiente, Fastly explicó que la acción inocente de un cliente activó un error de software que permanecía oculto en un programa informático y causó la caída generalizada.

Estos incidentes como la caída de los servicios de Google el pasado diciembre― han puesto en evidencia la vulnerabilidad de las conexiones digitales y la debilidad del sistema sobre el que se asienta el funcionamiento de la red en un momento en el que empresas y usuarios dependen más que nunca de ellas por el teletrabajo.