Recuerdo que, en mi primer trabajo, no ha pasado mucho, pero por allá por el 2009, las cintas magnéticas eran aún el medio más usado para temas de respaldos de información. ¿DAT72 les suena? En mi caso les temía, y ya les contaré por qué. Pero mi punto aquí es que yo admiraba a la persona que sacaba los respaldos, día tras día cambiando las unidades de cintas y usando el mejor software libre que podría existir para obtener dichos respaldos, Amanda. Pues 13 años después, creo que el temor no se ha ido, pero continuamos trabajando por minimizarlo, por lo que te invito a conocer de mi experiencia.
Primero que todo mi anécdota. Amanda es una de las herramientas de respaldos con las que obtener respaldos era lo mejor que había sin pasar por caja pagando una licencia de uso, por lo que la explotábamos en toda la granja de servidores que administrábamos. Pero nuestro punto débil era el medio en que almacenábamos estos respaldos, las cintas magnéticas de 72GB, que aunque las teníamos en condiciones ambientales promedio, con humedad y temperatura controlada, lo que le sucedió al encargado de las cintas es lo que a cualquiera le puede pasar, en el servidor de producción hubo un error en un arreglo de discos, conocido como, double faulted disk array o dos discos que fallan en un arreglo, un raid 5 con 2 discos dañados era difícil recuperarse, así que recurrimos a los respaldos. El respaldo se encontraba segmentado en 3 cintas de respaldo, por lo que se procedió a recuperar cinta por cinta, sin embargo, los astros se alinearon y la segunda cinta no respondía. Se fue probando recuperar de un día atrás.. y otro día más atrás… al final el respaldo de dos días atrás fue el que se pudo recuperar. Es decir, tuvimos pérdida de datos.
Para nuestra tranquilidad en esta época tenemos mejores alternativas de medios de almacenamiento para respaldos, ya sea local o no-local («nube»). En local tenemos grandes equipos con tecnologías de deduplicacion que hacen un excelente trabajo, mientras que lo que se va a nube en formato objetos pues nos deja con una tranquilidad en que ya podemos dormir sin pensar en que se puede presentar un problema de hardware en nuestro almacenamiento, no digo que no haya, sino que es manejable. Dejamos las cintas magnéticas al pasado y ahora si nos sentimos a gusto respaldando información de forma programada sin intervención humana. Aunque aún hay empresas que necesitan tener las unidades de cinta, por si acaso.
Hay varias formas de verificar si el respaldo ha sido obtenido con éxito. A pesar de que mi anécdota refleja que fue una falla física de la cinta nos deja un recordatorio bien marcado de revisar si los respaldos obtenidos sirven. Por lo cual, mi primera sugerencia es la verificación manual. es decir, mantener una buena práctica de restauración usando un día aleatorio y revisar el contenido del respaldo, verificar que el medio funcione bien y que se puedan usar los datos, porque de lo contrario tampoco nos servirían respaldos con datos inconsistentes.
Hay herramientas que prometen verificación automatizada mediante sandbox. Yo soy pro-automatización por scripts, y si una herramienta me permite crear perfiles con tareas y con un checklist para verificar que el contenido del respaldo es válido, pues bienvenido sea, en caso contrario, podríamos recurrir a la forma manual. Lo importante aquí es encontrar ese equilibrio entre asignar recursos para que se dediquen a verificar el respaldo, o confiar en una herramienta que lo haga. Personalmente prefiero verificarlo manualmente porque los sistemas fallan, los scripts fallan, así que debemos estar preparados.
Recuerda siempre probar el respaldo, no te detengas solo con ver que la cantidad de datos que se almacenaron del respaldo es la misma que se tiene en el origen, porque podemos tener fallas en el origen y se copian de igual forma con fallas en el respaldo. Déjame saber si necesitas algún consejo sobre como verificar un respaldo o como automatizar esto mediante scripts.
Por: Omar Córdova