Como recrear un GPFS Filesystem después de la perdida del disco

Escenario Storage Hitachi, Drivers HDLM, Aix, Lpar y GPFS


1) Identificamos el problema

Log con el problema de GPFS en los Aix /var/adm/ras/mmfs.log.latest

Thu Nov 11 09:24:50.439 2010: GPFS: 6027-2706 Recovered 1 nodes.
Thu Nov 11 09:28:45.048 2010: GPFS: 6027-1709 Accepted and connected to IP NODO2
Tue Nov 30 18:00:11.430 2010: GPFS: 6027-638 File system pm11prod_exp1 unmounted by node IP (NODO2-PRIV)
Tue Nov 30 18:00:11.514 2010: GPFS: 6027-474 Recovery Log I/O Failed, Unmounting file system <Filesystem>
Tue Nov 30 18:00:11.515 2010: GPFS: 6027-696 Too many disks are unavailable.
Tue Nov 30 18:00:11.528 2010: GPFS: 6027-473 File System <filesystem> unmounted by the system with return code 218 reason code 225
Tue Nov 30 18:00:11.529 2010: GPFS: 6027-696 Too many disks are unavailable.
Tue Nov 30 18:00:11.553 2010: GPFS: 6027-629 Node IP (NODO1-PRIV) resigned as manager for <Filesystem>
Tue Nov 30 18:00:11.555 2010: GPFS: 6027-700 Log recovery failed.
Tue Nov 30 18:00:11 GMT-03:00 2010: mmcommon preunmount invoked.  File system: <Filesystem>  Reason: SGPanic

La linea marcada con azul nos indica que perdimos un disco.

2) Si combinamos los  comandos del driver de hdlm y del gpfs para localizar el disco asociado a este filesystem

mmlsnsd ( de la ejecución de este comando obtenemos el disco nsd asociado a este filesystem)

dlnkmgr view -lu -c -item all ( de la ejecución de este comando obtenemos el disco físico en el Aix y el número de la Lun en el Storage)

3) Voy al nodo1 y elimino el disco en los Aix, rmdev -Rdl hdiskXX
4) Voy al administrador del Hitachi y le asigno otro disco de las mismas características, creo una Lun, elimino la Lun anterior y le asigno la nueva
5) Ejecuto el cfgmgr en cada nodo para detectar el nuevo disco y en el mismo orden que estaba el anterior
6) Preparo el disco, dd if=/dev/zero of=/dev/hdiskXX bs=64k count=1000
7) chdev -l hdiskXX -a reserve_policy=no_reserve -a queue_depth=8 -a rw_timeout=60
8) Desmonto el Filesystem en ambos nodos mmumount <punto de montaje>
9) Borro el Filesystem mmdelfs filesystem -p  (importante usar el parametro -p)
10) mmdelnsd nsd_hdiskXX
11) Edito el archivo de configuración para la creación del GPFS

#DiskName:PrimaryServer:BackupServer:DiskUsage:FailureGroup:DesiredName:StoragePool
hdiskXX:::dataAndMetadata::nsd_hdiskXX

12) Creo el disco nsd
mmcrnsd -F /tmp/gpfs_discos_oracle_26, esto lo ejecuto en un solo nodo
13) Si hacemos un mmlsnsd debería aparecer el disco nuevo como FreeDisk
14) Ahora estamos en condiciones de crear el Filesystem
mmcrfs <punto de montaje> <FileSystem> -F /tmp/gpfs_discos_oracle_26 -A yes -B1024K -M2 -m1 -R2 -r1 -n 4
15) Por último montamos el filesystem
          mmmount <Filesystem>

Comentarios