Este post no hace referencia a incesto ni nada de eso, sino a ese fanatismo que tenemos los geeks por tipear de corrido durante horas. La travesía empezó el jueves, cuando me entero que Filomena, el server de Machu, había dejado de responder. Machu y yo eramos la única oportunidad que tenía ese desafortunado aparato.
Parecía una situación dominada, poco deseada, pero controlada. El filesystem del FreeBSD en cuestión había trulado. Nada que un fsck no pueda resolver. Machu salió a las 10am para ver como podía reavivar la máquina. Solo para resumirlo, salí de mi laburo a las 7pm para darle una mano y fui para Prima. Terminamos a las 7:30am del viernes, con un sistema operativo que trastabillaba, que a duras penas podía mantenerse en pié, que se colgaba si leía un bloque defectuoso.
Pasó el viernes, entre rebuteadas y dedasos, reclamos y bostezos, sabiendo que “teníamos todo el fin de semana para arreglarlo”. El sábado a la mañana fuimos a ver de tratar de solucionar el problema, cambiar el disco, levantar los backups, etc. “Cuanto puede tomarnos”. Nuevamente, llegué a casa las 8am del domingo, mientras el lento pero efectivo backup hacía el restore. Volvimos a la carga a la 1pm, después de dormir y comer un poco. Afinados los últimos detalles, a las 10pm probamos todos los sitios y a dormir.
Algunas cosas a tener en cuenta:
- Voy a empezar a juntar firmas para que FFS soporte journaling.
- Si el disco que debe montar por fstab no se encuentra, levanta en modo single.
- El último parámetro del fstab es para decirle que no haga el chequeo del inicio para esa partición o disco.
- Montar un slide de otro disklabel es, a mi humilde entender, imposible.
- Eso del master.passwd es inentendible.
- Es, sin duda, imperativo tener un plan de contingencia, redundancia y backups de todo lo posible.
- El restore de Plesk tarda unas 10 horas. Y conviene hacerlo dominio a dominio.
- El mensaje ‘Out of memory!’ de FreeBSD no tiene otro objetivo más que el de tildar el proceso, y si es posible, la máquina.
- Deberíamos migrar ese server a un sistema operativo serio :).
- El scripting es una herramienta fundamental para el administrador.
Veamos lo bueno que podemos sacar en limpio:
- Pasó lo peor que puede pasarle a una empresa de hosting. Y sobrevivió. Eso es más que bueno. Costó, pero saber que se pueden superar crisis de este tipo es tranquilizante.
- La máquina de café de Prima da perdida. El café cuesta 40 centavos (poco más de 10 centavos de dolar), lo que ya es poquísimo, además entrega mal el vuelto. Siempre devuelve 20 o 30 centavos de más. E incluso llegó a dar ganancia: con 1 peso me llevé un café y 1,10 pesos de vuelto. Una ganga :D.