El archivador de disco automático avanzado para red de Maryland (AMANDA)
Tradicionalmente, los respaldos han sido programados para hacer salvas Completas de todo en el fin de semana y luego respaldos incrementados a lo largo de la semana. Esta estrategia tiene varios inconvenientes.
- El tiempo del respaldo en los fines de semana es mucho mayor que los realizados durante la semana.
- El uso de la cinta durante la semana es muy poco, pero debido a que los respaldos de los fines de semana son muy largos usted debe tener cintas de gran tamaño. Esto significa perdida de cinta durante la semana.
- Para recuperar un directorio completo de el día viernes son necesarias las cintas de los días lunes, martes, miércoles y jueves.
Amanda cambia el paradigma. El objetivo primario de Amanda es balancear el uso de la cinta cada noche. Para lograr esto, se varían los días en los cuales las entradas de respaldo (más sobre esto un poco más adelante) son volcadas completamente, de forma tal que cada una de las noches la cantidad de datos respaldados sea más o menos igual. Esto quiere decir que:
- El tiempo de respaldo es aproximadamente el mismo todas las noches.
- El uso de la cinta es uniforme, de esta forma los dispositivos más pequeños pueden ser usados y la cinta no tiene por que ser mal gastada.
- Para recuperar del día viernes un directorio completo, se puede necesitar en el mejor de los casos, una sola cinta y en el peor un costoso ciclo de volcado de cintas (más sobre esto un poco más adelante).
A lo largo de este documento usted verá referencias a “cinta” con frecuencia. Debe saber que esto no necesariamente quiere decir cinta magnética. Amanda soporta restauras de disco duro (a través del driver de archivo) o aun la facilidad RAIT, la cual podría estar en múltiples cintas o incluso en combinaciones de ellas.
1. Términos Importantes
Cuando se habla sobre cualquier tema, es bueno tener un vocabulario común. A continuación están algunos de los términos importantes que deben ser comprendidos.
Nivel 0
Una salva completa, o respaldo de algunos ficheros. Esto quiere decir que cada uno de los ficheros es salvado para la posterior restauración.
Nivel 1
El primer respaldo incrementado de los ficheros. Esto quiere decir que solo los ficheros que han sido cambiados, después del último Nivel 0 han sido almacenados para la restauración posterior.
Nivel n
El respaldo incrementado de los ficheros desde el último respaldo Nivel n-1.
|
NOTA: Los niveles en ocasiones son difíciles de comprender, así que tenemos un ejemplo disponible. |
Disklist Entry (DLE)
Amanda almacena los elementos que serán respaldados en el fichero disklist, de esta forma cada elemento se convierte en una Entrada Disklist.
dumpcycle
La mayor cantidad de tiempo en la que la DLE recibe un respaldo Nivel 0. Usualmente una semana.
runspercycle
La cantidad de veces, durante dumpcycle para la cual Amanda será ejecutado. (Usualmente 7 o 5 veces para cada noche de la semana, asumiendo un dumcycle de 1 semana.)
tapecycle
El número de cintas que Amanda debe usar antes de “reciclar” cintas. (Idealmente esto sería a lo mínimo 2 * runspercycle + 1. De esta forma usted obtiene dos juegos de respaldos, además de una cinta extra para si algo le va mal.)
2. Amanda es un programador
A menudo preguntan: ¿ Soporta Amanda mi dispositivo 2000 de Cinta ACME Ultra Profesional?, y la respuesta es: ¿ su Sistema Operativo lo soporta ?
La razón para esto es que Amanda, actualmente, no conversa directamente con el dispositivo de cinta. Depende de algunas utilidades del Sistema Operativo tales como dd, tar y muchas de las funcionalidades de dump para realizar su tarea. Amanda calcula meramente el dato apropiado que necesita ser salvado, basándose en los parámetros que se le pasaron y los programa apropiadamente. ¿Como se programan las cosas ? Las definiciones de arriba pueden proporcionarnos un punto de partida pero en esta sección vamos a explicarlas un poco más.
Amanda programa los respaldos basándose mayormente en las tres variables listadas arriba: dumpcycle , runspercycle y dumpcycle. Amanda asegura (con la mejor de su habilidad) que cada una de las DLE individuales reciba al menos un respaldo Nivel 0 por dumpcycle. Es al menos uno porque Amanda puede promover un respaldo para recibir un respaldo Nivel 0, después de su tiempo regularmente programado (recuerde el principal objetivo de Amanda – balancear el uso de la cinta) para balancear el tamaño de la información. La variable runspercycle le permite conocer a Amanda cuantos cambios tiene para ajustar todo durante un dumpcycle. tapecycle es una salvaguarda para asegurar que usted no sobrescriba los datos que no se deberían sobrescribir.
3. Amanda en CentOS
Hace mucho tiempo se tomó la decisión de que la configuración en los clientes de Amanda no era necesaria. Esto es bueno si usted respalda algunos cientos de máquinas, sin embargo esto tiene los inconvenientes de que algunas opciones deben ser compiladas en los binarios de los clientes. Entre estas, están la dirección/nombre del host de su cinta y de sus servidores índice. Esto presenta un problema interesante para aquellos que empaquetan los binarios de Amanda (ej cada una de las distribuciones de Linux); ellos no pueden conocer las configuraciones de todos los clientes a la hora de compilar, por ello deben realizarse algunos ajustes. El mayor de los problemas con esto es el uso de localhost como el nombre del servidor. (Para ver por qué esto es un problema vea la Top Ten List). Debido a esto se recomienda reconstruir los RPMS para su propio entorno.
|
IMPORTANTE: La última versión de Amanda (2.5.1 y superior) ha roto con la tradición y ahora puede usar un fichero de configuración en el cliente. Para los detalles de este fichero vea http://wiki.zmanda.com/index.php/Amanda-client.conf. |
Para CentOS 3 y 4, cambiar los valores que vienen por defecto requiere editar el fichero .spec. En el futuro CentOS-5 y los posteriores han cambiado y realizado los cambios en el fichero .spec para rectificar este problema. Para más información en esto, vea http://www.math.ohiou.edu/%7Ehyclak/casit/amanda/ , donde están disponibles los detalles en la reconstrucción de los últimos RPMs de Amanda 2.4.5 (con los cambios en el fichero .spec).
Para aquellos de ustedes que no desean reconstruir la última versión 2.4.5 de Amanda en su sistema CentOS, aquí está como puede reconstruir los paquetes disponibles para su entorno (usando CentOS-4 como ejemplo):
- Descargue el fichero amanda-2.4.4p3-1.src.rpm
Instale el rpm fuente: rpm -i amanda-2.4.4p3-1.src.rpm. Esto extraerá el contenido dentro de su directorio rpm (haciéndolo como root, /usr/src/redhat/). Usted realmente debería hacer esto como un simple usuario y de esta forma haber configurado el fichero .rpmmacros.
- Edite el fichero SPECS/amanda.spec para reflejar los servidores apropiados y cualquier otro cambio que necesite realizar. Además se recomendaría cambiar la etiqueta Release: para indicar que usted a realizado cambios (use iniciales o algo parecido).
- Reconstruya los rpms: rpmbuild -ba SPECS/amanda.spec
- Disfrute su reciente RPM personalizado.
4. Enlaces
5. Ultimas Entregas
La serie 2.5 es la entrega estable actual. 2.5.x trae consigo autentificación SSH, medición a palmos de la cinta y un montón de otras funcionalidades. Vea http://wiki.zmanda.com/index.php/2.5.2_features.