Página siguiente Página anterior Índice general

5. Comprobación

Si piensa usar un RAID para obtener tolerancia a fallos, también puede que quiera comprobar su configuración para ver si realmente funciona. Ahora bien, ¿cómo se simula un fallo de disco?.

El resumen es que no puede, salvo quizás atravesando mediante un hacha incandescente la unidad sobre la que quiere simular el fallo. Nunca puede saber qué ocurrirá si un disco muere. Puede que se apodere eléctricamente del bus al que está conectado, haciendo que todas las unidades de ese bus sean inaccesibles, aunque nunca he oído que eso haya ocurrido. La unidad también puede simplemente informar de un fallo de lectura/escritura a la capa SCSI/IDE que a su vez hará que la capa RAID maneje esta situación de forma elegante. Afortunadamente, esta es la forma en la que normalmente ocurren las cosas.

5.1 Simulación de un fallo de disco

Si quiere simular un fallo de disco desconecte la unidad. Debe hacer esto con el sistema apagado. Si está interesado en comprobar si sus datos pueden sobrevivir con un disco menos de los habituales, no hay motivo para ser un vaquero de las conexiones en caliente aquí. Apague el sistema, desconecte el disco y enciéndalo de nuevo.

Mire en el registro del sistema (generado por syslogd) y en /proc/mdstat para ver qué es lo que está haciendo el RAID. ¿Ha funcionado?.

Recuerde que debe utilizar un RAID-{1,4,5} para que su array sea capaz de sobrevivir a un fallo de disco. Un modo lineal o un RAID-0 fallarán totalmente cuando se pierda un dispositivo.

Cuando haya reconectado el disco de nuevo (recuerde, con el sistema apagado, naturalmente) podrá añadir el nuevo dispositivo al RAID otra vez, con la orden raidhotadd.

5.2 Simulación de corrupción de datos

Un RAID (ya sea hardware o software) asume que si una escritura en un disco no devuelve un error, entonces la escritura ha tenido éxito. Por tanto. si su disco corrompe datos sin devolver un error, sus datos se corromperán. Naturalmente, esto es muy improbable que ocurra, pero es posible, y produciría un sistema de ficheros corrupto.

Un RAID no puede y no está pensado para proteger contra la corrupción de datos del medio de almacenamiento físico. Por tanto, tampoco tiene ningún sentido corromper a propósito los datos de un disco (usando dd, por ejemplo) para ver cómo manejará el sistema RAID esa situación. Es más probable (a menos que corrompa el superbloque del RAID) que la capa RAID no descubra nunca la corrupción, sino que su sistema de ficheros en el dispositivo RAID se corrompa.

Así es como se supone que funcionan las cosas. Un RAID no es una garantía absoluta para la integridad de datos, simplemente le permite conservar sus datos si un disco muere (naturalmente, con RAIDs de niveles iguales o superiores a 1).


Página siguiente Página anterior Índice general