Hice un script para respaldar la información que tengo en mi computadora, lo que hace es lo siguiente:
- Hace respaldos incrementales de los directorios que se le indican.
- Los respaldos son del tipo instantáneas (snapshots).
- Muy sencillo de respaldar y recuperar directorios.
Los respaldos de tipo instantáneas son muy útiles, ya que puedo ver todos los archivos de un directorio y decidir los que me hacen falta, pudiendo navegar por ellos dependiendo de la periodicidad del respaldo.
El que sean incrementales es útil ya que se ahorra espacio solo copiando aquellos archivos nuevos o que tuvieron cambios.
Ahora bien, no importa que un archivo no haya tenido cambios, este aparecerá en cada instantánea que se haya tomado del directorio donde se encontraba, pero solo ocupara espacio como un archivo, esto se logra creando vínculos fuertes o duros al archivo, es decir se encuentra en todas las instantáneas pero solo ocupa un espacio.
Esto da la facilidad que se pueden hacer respaldos cada hora si se desea, si solo se modificó un archivo de 100Kb solo se ocupará el espacio de 100kb, pero para nosotros será como si tuviéramos un nuevo respaldo con todos nuestros archivos.
Si hasta aquí estás convencido, entonces te puedo contar porque hice este script.
Desde hace algún tiempo hago respaldos de los directorios más importantes de mi equipo a otro disco duro de mi mismo equipo, y tiene algún tiempo que lo hago a un NAS que configuré, el problema que me encontré con mi tipo de respaldos es que si solo necesito un archivo, tengo que obtener todo el respaldo, y una vez que lo obtengo saco el archivo, otro problema es que como no son respaldos incrementales, ocupo mucho espacio en cada respaldo y no puedo tener muchos.
Cuando leí de unos nuevos programas para respaldar como son backintime, flyback o timevault; los cuales se encuentran inspirados en el sistema de respaldos de MAC OS X llamado Time Machine. Pensé que podía ser una buena oportunidad para cambiar mi sistema de respaldos.
Probé con el que sonaba que tenía más movimiento, en este caso el backintime, pero lo que no me gustó fue que al menos el que yo probé, si yo hacía un pequeño cambio en un archivo volvía a sacar un respaldo completo de todo mi directorio o directorios que estaba respaldando. En un principio pensé que a lo mejor algo estaba haciendo mal, pero buscando un poco en los foros del programa leí algo como lo siguiente: «si solo modifico un mb de información, ¿porqué se tiene que respaldar todo el directorio de nuevo?». Según comentaban este era un comportamiento similar en Time Machine.
Por esta razón busqué alguna herramienta que hiciera algo similar a lo que necesitaba, en mi búsqueda encontré un programa muy sencillo llamado rdiff-backup, este hace un respaldo del directorio que se le indica y va haciendo respaldos incrementales del mismo con la periodicidad que se necesite, pero tiene un gram problema, recuperar o inclusive revisar si un archivo de una determinada fecha tiene una modificación se vuelve bastante engorroso, uno tiene que navegar mediante la línea de comandos, e inclusive ir sacando del respaldo archivo por archivo lo que uno va necesitando, sin saber a ciencia cierta si el archivo es o no es lo que uno necesita.
Sistemas como rdiff-backup se basan en el hecho de que si yo hago un respaldo de un directorio, lo más seguro es que si recupero voy a saber de que día necesito recuperar el archivo, y de que muy seguramente voy a necesitar el respaldo completo. Este principio era muy válido en tiempos anteriores donde uno corría procesos diarios semanales y quincenales, y sabía la fecha del último proceso válido, pero en las épocas actuales uno no sabe en que fecha modificó un archivo y si en realidad es el que necesita, además de que a lo mejor solo se necesita un archivo de un respaldo de varios gigabytes de información.
La idea de tomar instantáneas me había agradado y me parecía la mejor forma de resolver mi problema, por lo que investigando un poco más, ubiqué una serie de páginas que me indicaban como hacer respaldos incrementales rotativos «Mejorando mi estrategia de copias de seguridad» y «Easy automated snapshot-style backups«; los que me dieron las bases para completar un script que cumpliera lo que necesitaba para mis respaldos.
Que es lo que hace el script:
- Realiza respaldos de los directorios que se le indican.
- Los deja donde uno le diga
- Puedo navegar entre los archivos de cada respaldo que a mis ojos es como si tuviera todos los archivos del directorio con la misma estructura del directorio original.
- Recupero el archivo que necesito con un simple copiar y pegar.
- Los respaldos son incrementales, es decir no me genera más espacio por archivos que no se hayan modificado.
- Me indica la fecha y hora de los respaldos.
- Decido el tiempo que deseo conservar los respaldos, ya sea en días o borrándolos de forma manual.
El script en bash es como sigue:
[cc lang=»bash»]
#!/bin/bash
#
# Programa para realizar respaldos de un directorio, la ventaja es que hace
# un respaldo del tipo instantánea (snapshot) donde en cada dia el usuario
# puede encontrar todos los archivos tal y como se encontraban al momento
# en que se hizo el respaldo.
#
# Además para el usuario es como si se hubieran respaldado todos los
# archivos, pero en realidad solo se respaldan los cambios, creándose
# enlaces duros a los archivos existentes.
#
# Se recibe como parametro el directorio para dejar los respaldos.
#
# Los respaldos se dejan en un directorio que indica la fecha y hora
# del respaldo, de esa forma queda más fácil navegar por ellos.
#
# Los respaldos conservan integra la estructura y permisos del directorio
# que respaldan.
#
# ****VARIABLES IMPORTANTES****
#
# $1 – Parametro que indica el directorio donde van todos los respaldos
# $2 – Parametro que nos dice el numero de dias que se conservan los respaldos
# $fecha – Fecha del respaldo y nombre del directorio donde se va a
# guardar el respaldo actual
# directorios – Archivo que tiene los directorios que se van a respaldar
# $directorio – Directorio que se está respaldando
#
# 29 de enero del 2009
# Destructor
# Obtiene fecha y hora de respaldo
fecha=»$(date «+%Y-%m-%d-%H:%M:%S-%A»)»
echo
echo «============================================================»
echo «Fecha y hora del respaldo $fecha»
# Borra respaldos mayores al numero de dias que se especifiquen
echo
echo «============================================================»
echo «Respaldos borrados»
find $1 -maxdepth 1 -name ‘2*’ -mtime +$2 -print -exec rm -rf {} \;
# Obtiene el directorio de respaldo más reciente
for archivo in $(ls -t $1 –group-directories-first)
do
echo «El respaldo anterior se encuentra en $archivo»
# Respalda cada uno de los directorios indicados en el
# archivo de respaldo llamado directorios
for directorio in $(cat $1/directorios)
do
echo
echo «**************************************************************»
echo «Respaldando el directorio $directorio»
# Crea directorio para respaldar
mkdir -p $1/$fecha$directorio
rsync -av –delete –link-dest=$1/$archivo$directorio/ $directorio/ $1/$fecha$directorio/
done
echo
echo «///////////////RESPALDO CONCLUIDO//////////////////»
exit 0
done
[/cc]
Para usarlo es muy sencillo, solo se debe hacer lo siguiente:
1. ¿Donde voy a guardar los respaldos?
Con tener un directorio en mi equipo, en un disco duro externo, o en otro equipo con espacio para lo que necesito debe ser suficiente, digamos que el directorio donde voy a guardar los respaldos se llama: /mnt/Multimedia/Respaldos.
2. ¿Qué directorios voy a respaldar?
Dentro del directorio donde voy a guardar los respaldos se debe crear un archivo con nombre «directorios» que por cada línea indique los directorios que se van a respaldar, más o menos como sigue:
[cc lang=»bash»]
/home/rponcedeleon/Documentos
/mnt/Imagenes/Portables
/mnt/Imagenes/Proyectos
[/cc]
Tener cuidado de no colocar la diagonal final en los directorios que se van a respaldar.
3. Copiar el script que se encuentra en las líneas superiores y darle permisos de ejecución, yo le puse por nombre respaldo.sh, pero en realidad puede ser el que se quiera.
4. Decidir los dias que se necesitan guardar los respaldos.
Ahora ya se puede ejecutar el script, podemos probarlo con una ejecución directa desde el directorio donde hayamos guardado el script, por ejemplo:
[cc lang=»bash»]
sh respaldo.sh /mnt/Multimedia/Respaldos 30
[/cc]
Con esto le estamos indicando que queremos hacer un respaldo de los directorios que se encuentran en el archivo directorios que debimos haber guardado en /mnt/Multimedia/Respaldos, y que solo queremos conservar 30 días de respaldos.
Al ejecutar el script podemos observar que nos indica la fecha del respaldo, si existe algún respaldo anterior, los respaldos que borró, y los archivos que respaldó; en este caso por ser nuestro primer respaldo nos va a dar mucha información y se va a tardar bastante, los siguientes respaldos serán más breves.
El script nos debe entregar una salida, similar a esta:
[cc lang=»bash»]
============================================================
Respaldos borrados
============================================================
Fecha y hora del respaldo 2009-01-31-23:39:22-sábado
El respaldo anterior se encuentra en 2009-01-31-20:19:28-sábado
**************************************************************
Respaldando el directorio /home/rponcedeleon/Documentos
sending incremental file list
./
CIC/Programas/
CIC/Programas/respaldo.sh
sent 83531 bytes received 365 bytes 167792.00 bytes/sec
total size is 1040765788 speedup is 12405.43
**************************************************************
Respaldando el directorio /mnt/Imagenes/Portables
sending incremental file list
./
sent 1176 bytes received 19 bytes 2390.00 bytes/sec
total size is 491212357 speedup is 411056.37
**************************************************************
Respaldando el directorio /mnt/Imagenes/Proyectos
sending incremental file list
./
sent 51036 bytes received 329 bytes 34243.33 bytes/sec
total size is 3357108911 speedup is 65357.91
[/cc]
Ahora, si vamos al directorio /mnt/Multimedia/Respaldos, podemos observar que tenemos un nuevo directorio de tipo 2009-01-30-13:28:02-viernes, que tiene el respaldo de los directorios que le indicamos, tal cual la estructura de los directorios originales, y conservando los permisos originales, vínculos, archivos ocultos, es decir todo.
Si volvemos a ejecutar el script, observaremos que ahora la información es menor, sino cambiamos nada solo serán mensajes de avisos, y si volvemos a navegar en nuestro directorio de respaldos a lo mejor veremos un nuevo directorio como el que sigue 2009-01-30-13:40:02-viernes.
Es decir, tenemos dos directorios de respaldo, y si navegamos en él, tenemos todos los archivos de nuestros directorios; es decir tenemos dos instantáneas de respaldos, pero si observamos el espacio en disco, los archivos no están duplicados.
Esta es la maravilla, solo respalda los archivos modificados o nuevos, pero podremos navegar por nuestros respaldos con la ayuda de nuestro navegador favorito, de hecho el directorio de respaldos pudiera lucir como sigue:
Aquí se observa como con la ayuda de mi navegador (konqueror) busco entre los diferentes respaldos que conservo para ubicar un archivo, lo interesante de esto es que no se duplica espacio en disco y sigo conservando la facilidad de buscar en cuantos respaldos necesite, de una forma sencilla, sin aprender una nueva interfaz y si quiero puedo tener muchos respaldos al día.
Para mayor facilidad puede ser conveniente que la salida del script la mandemos a un archivo de bitácora donde puedo ver con más calma lo que pasó durante su ejecución, esto lo puedo lograr con una línea como la que sigue:
[ccc lang=»bash»]
sh respaldo.sh /mnt/Multimedia/Respaldos 30 >> /home/rponcedeleon/respaldo.log
[/cc]
Con los dos «>>» le indico que la salida del script se vaya a un archivo respaldo.log que se encuentra en /home/rponcedeleon, que si el archivo no existe lo crea, y si existe le agrega más líneas.
Para dejar sus respaldos que se ejecuten cuantas veces necesiten lo pueden incluir en cron, o en anacron.
En mi caso yo lo incluí al arranque de mi sesión, entonces antes de hacer algo, lo primero que hace mi sistema es respaldar cualquier cosa que pude haber hecho en mi sesión anterior.
Por la forma en que se encuentra el script puedo respaldar diferentes directorios con diferentes criterios; a lo mejor algunos necesito hacer un respaldo a la semana, o cada tercer día; o conservar solo una semana de respaldos o un mes; solo debo correr el script con parámetros diferentes.
Por otro lado no existe problema en quitar o agregar directorios al respaldo, desde el momento que lo hagamos podremos apreciar el cambio en el respaldo correspondiente, ya que el script respeta la estructura de directorios que se le indique.
Esperando que este script les sea tan útil como a mi, me despido.
Hola:
Muy bueno esta el script para hacer respaldo, ademas que solo guarda los nuevos archivos y los modificados. Solo les dire que encontre un detalle en e script. Pues tuve que modificar el valor de la variable fecha que tenia:
fecha=”$(date “+%Y-%m-%d-%H:%M:%S-%A”)”
lo cambie por
fecha=$(date +%Y-%m-%d-%H:%M:%S-%A)
pues el directorio para el respaldo se creaba con el nombre mal.
De todas maneras mi gracias por compartir esta utilidad que les servira a mas de uno.
GRACIAS
Gracias por el comentario, voy a tomar nota para probarlo, yo lo tengo como el original y si me funciona a la perfección.
Saludos
Desde ya muchas gracias por publicar este tipo de ayuda, es muy util.
Veamos si me pueden ayudar, hasta el momento el script solo me hace el respaldo completo cada vez que lo ejecuto ya que el comando -group-directories-first me retorna un error de opcion no conocida, estoy usando ubuntu server 6.06
¿Pueden ayudarme?
Desde ya muchas gracias
Hola Emanuel, pues mira la opción –group-directories-first, forma parte del comando «ls», busca en el manual para ver si en tu versión viene, otra es que la estés tecleando con un guión, debe ir con dos guiones.
Saludos, espero te sea de utilidad
Hola Destructor, estuve probando tu script y la verdad que esta muy bien…Te hago una consulta. Yo tengo varios archivos sueltos en distintos directorios, y me gustaria que tambien los incluya en el respaldo, pero sin incluir la totalidad de archivos del directorio…Eso es posible??
Saludos y Gracias.
Pues no, por lo pronto no, tendrías que colocar el archivo en un directorio y decirle que respalde el directorio. Tomo nota y para mediados de año sacó una nueva versión, espero que ya sea con xml.
Saludos y gracias.
Destructor, gracias por responder
En el comando ls de la distro que estoy usando no forma parte la opcion –group-directories-first, también confirmé que la estoy escribiendo con dos guiones.
Alguna pista de que puedo hacer sin cambiar la distro.
Gracias
Perdón por no contestar antes, pues si le quitas la opción de –group-directories-first no deberías tener problemas, solo se la puse para que la primera vez que intentes un respaldo no te diga que tu respaldo anterior se encuentra en directorios. Eso solo ocurriría la primera vez, la segunda vez el mensaje ya seria congruente.
Saludos y gracias por los comentarios
Destructor, muchas gracias. Quite la opcion –group… y ahora si está haciendo respaldo incremental, antes sin poner esas lineas de codigo me hacia un respaldo completo cada vez.
Muy agradecido
Hola
Cuando empiezo a hacer el respaldo solo me crea directorios y ningún archivo. Pensé que era por los días que le pedía de respaldo: lo cambié de 30 a 30000 y me sigue generando solo directorios.
¿sabrás que está pasando?
Saludos
Hola que tal, se ve muy bien el script, la verdad estoy buscnado y me gustaria saber si me podras ayudar, necesito un script que realice respaldos de puro archivo de texto, bueno gracias man, saludos.
PUES NO HE PODIDO HECHAR ANDAR EL SCRIP DESEO HACERLO E WINDOWS VISTA
Hola…
En primer lugar, y quizá constestando al último comentario, para hacerlo funcionar en Windows se ha de utilizar el Cygwin, que permite «emular» línux sobre windows.
Por otra parte, a mi e script si me funciona, es decir hace la copia, pero tiene los siguientes problemas.
1º Un error «ls: cannot access group-directories-first: No such file or directory». Supongo que quiere decir, que como no pasaron 30 días no encuentra ese directorio.
2º Otro error «–link-dest arg does not exist: //192.168.0.215/copia». No sé que es lo que pasa, porque la copia la hace perfectamente.
3º Y por último, la copia la hace bien, pero me copia todo en otro directorio, con la consiguiente duplicación de datos. El scrip lo hago funcionar en Windows utilizando cygwin, y duplica los datos, es decir, que si en las propiedades de cada directorio, por ejemplo, tengo 10 megas, sumando el tamaño de la siguiente copia tengo 20 ocupados, y así sucesivamente.
Agradecería algún comentario sobre estas cuestiones, que me gustaría solucionar, porque el script me parece de lo más útil. Yo ya utilizaba rsync para hacer copias, pero de una forma muy básica.
Gracias. Un saludo.