Datamation le presenta diez consejos útiles de Gartner a tener en cuenta respecto a los planes de recuperación ante desastres.

 

 

El columnista de Datamation, Paul Rubens, analizó algunas de las razones por las que los planes de recuperación ante desastres pueden fallar. Y lo hizo partiendo de un caso real, el de una compañía de la costa atlántica de los EE.UU, Allied Building Products que, en 2012, sufrió los embates del huracán Sandy.

El centro de datos de esta compañía se inundó, fue arrasado por el agua y desapareció en pocos minutos. La organización contaba con un plan de continuidad y recuperación ante desastres basado en los servicios de SunGardk, en la ciudad de Filadelfia. Los servidores y aplicaciones volvieron a la actividad y la infraestructura de IT siguió operando durante tres meses antes de poder ser transportada al nuevo centro de datos de Allied.

Si bien el plan había sido preparado cuidadosamente, el director de IT de Allied admitió que “muchas cosas vimos que no las habíamos pensado lo suficientemente bien. Creo que es porque nadie realmente piensa que le tocará enfrentar un desastre. Creemos que nunca perderemos una aplicación o que podemos vivir sin ella si falla, pero lo que ocurrió fue que no pudimos,” explica Scott Fisher.

Afortunadamente SunGard tenía suficiente hardware libre en su centro de datos para que esas aplicaciones lograran funcionar de todos modos y el problema se superó. Pero este episodio ilustra un hecho innegable: Los planes de recuperación ante desastres no son más que eso, planes. Esto equivale a decir que nunca estaremos seguros de que serán suficientes para evitar que nuestra compañía no pase a ser una de las que forman parte de ese 43% que, según Gartner, nunca se recupera después de un desastre.

Diez recomendaciones de Gartner

Roberta Witty, experta en continuidad de Gartner, afirma que ciertas cosas muy simples fueron subestimadas antes de que Sandy demoliera las previsiones ante desastre de muchas compañías. “Algunos planes preveían que la gente trabajara desde sus casas, pero en ese caso no pudieron porque los cortes de energía alcanzaron a toda la región,” nos dice Witty.

Otros planes fracasaron porque las compañías no pudieron anticipar o prever la duración de los cortes de energía causados por el huracán. “Las compañías habían previsto cortes de hasta tres días y fueron cinco o más. Hacía falta más equipamiento, backup de datos, energía… más de todo.”

Witty sostiene que en la mayoría de los casos, alcanzaría con dar ciertos simples pasos para asegurarse de que los planes de recuperación serán efectivos. “Las compañías más proactivas habían seguido los pronósticos y habían llevado a su staff a otras ubicaciones el viernes, con la debida anticipación,” nos dice Witty refiriéndose a la tormenta que llegó a Nueva York el día lunes.

Es por eso que, para maximizar las posibilidades de que un plan de recuperación ante desastres sea positivo, Gartner recomienda tener en cuenta estos diez consejos:

    1-  Concentrarse en los Backups. No importa qué tan bueno sea el resto del plan de recuperación ante desastres si no se tienen los datos correctos para su restauración. Los problemas pueden ir desde no contar con backups viejos a datos corruptos o al descubrimiento de que los datos de ciertas aplicaciones no han sido respaldados.

No hay que olvidar que en el caso de un desastre importante como el de Sandy no estará disponible si se lo almacena en un lugar cercano. En el planeamiento de un desastre, hay que asegurarse de que los datos de backup sean copiados a un sitio geográficamente lejano.

   2-    Asegurarse de que todos los miembros del staff estén involucrados en el plan de contingencia. El general Eisenhower una vez dijo “al prepararme para una batalla, siempre encontré que los planes eran inservibles, pero la planificación es indispensable.” Esto mismo aplica en el planeamiento de la recuperación ante desastres: el personal clave debe estar involucrado en la creación del plan, ya que es la propia actividad de planeamiento la que es base de la potencial recuperación.

   3-     Probar todo lo que se pueda. La prueba del plan de recuperación es vital para detectar si es que trabaja y poder corregir en una situación controlada. Pero no hay que olvidar que los test de planes no son capaces de mostrar si es que funcionarán a las 4 de la mañana bajo un huracán o inundación.

El testeo servirá como sesión de práctica y profundización de detalles y para que el staff se familiarice con los procedimientos y con el papel que tendrá. Probar con la mayor frecuencia posible aumenta la posibilidad de descubrir cosas que pueden haber sido pasadas por alto, tales como nuevo hardware, aplicaciones o dependencias que no han sido incorporadas en el plan.

La contra de esta práctica de pruebas frecuentes es que insume tiempo y cuesta dinero, especialmente cuando los planes de recuperación ante desastres involucran el uso de instalaciones de proveedores o terceras partes. Si ese es el caso, será necesario programar las sesiones de prueba con anticipación. Habrá que gastar bastante si se planea hacer más de una prueba anual   

          4- Asegúrese de que el plan esté bien documentado. Si los procedimientos del plan no están descritos con la suficiente claridad y detalle, el plan puede fracasar. Es probable que los planes puedan funcionar bien en los ensayos aunque no estén suficientemente detallados. La gente del staff puede apoyarse en sus conocimientos de los sistemas, aplicaciones e infraestructura y consultarse entre sí, pero en la eventualidad de un desastre real, esa gente puede no estar disponible. Aquí lo básico es que las pruebas exitosas pueden engañar con el supuesto o ilusión de que el plan puede ser implementado en un desastre, pero en realidad no lo será porque no contiene los detalles y descripciones necesarias.

   5-     Revisar el plan con la mayor frecuencia posible. Desde el momento en que se completa un plan, las configuraciones de producción y las de recuperación pueden comenzar a divergir en términos de equipamiento, aplicaciones y cambios de staff. Esto quiere decir que los planes de recuperación ante desastres estarán desactualizados tan pronto como se hayan terminado de confeccionar. Es por esa razón que hay que revisarlos y actualizarlos en forma frecuente y regular. Una vez a la semana podría ser demasiado, pero una vez al año sin duda no es suficiente.

$   6-      Amplíe la investigación de los temas importantes. La continuidad del negocio consiste en garantizar que se contará con los sistemas, aplicaciones y datos que hacen falta si ocurre un desastre, además de tener las funciones importantes prontamente en línea. Un error muy común es el de subestimar la dependencia que se tiene respecto a ciertas aplicaciones o datos y descubrir que no están disponibles después que ocurre el desastre. Es por eso importante recordar que las empresa recuperará su funcionamiento cuando esté TODO lo que es necesario para que eso ocurra.

$ 7-   Garantizar la provisión de energía. Los desastres suelen acarrear cortes de energía eléctrica que muchas veces duran aún más que el evento desastroso. Si el plan de contingencia involucra el uso de energía generada por la empresa, es vital asegurarse de que se cuenta con la suficiente cantidad de combustible para que los generadores funcionen varias semanas, no sólo días u horas. Es necesario tener potencia por todo el tiempo que dure la interrupción.

   8-      No olvidar las comunicaciones. Si un desastre golpea, se hace necesario que la gente trabaje desde ubicaciones remotas para poner el plan de contingencia en acción, ya sea en oficinas propias o de las terceras partes. Pero en un desastre real, el staff puede no ser capaz de acceder a líneas fijas o sistemas de telefónica móvil tan fácilmente como pueden hacerlo en un escenario de prueba. Esto significa que el plan debería detallar cómo se manejarán las comunicaciones en el caso de un corte masivo y ese detalle deber contemplar la mayor cantidad de alternativas posibles. Muchas compañías le dan a la gente clave de su staff teléfonos satelitales para este fin y también están experimentando con medios sociales para hacer llegar mensajes.

   9-      Evitar bloqueos por no tener registro de las contraseñas. Puede que los procedimientos de recuperación funcionen muy bien pero no hay que olvidar que los sistemas deben estar utilizables una vez que entren en funcionamiento. Esto es que el staff tenga acceso a los passwords y otras credenciales de autenticación en los sitios donde se opera la recuperación ante desastres. Si no se cuenta con los passwords de los sistemas, en esos sitios, especialmente en los de terceras partes, los planes de continuidad serán inoperables.

   10-   Asegurarse de que el plan sea accedido en caso de desastre. Finalmente, Gartner recomienda que el staff necesitará tener ante sí el plan para poder ejecutarlo. Hay que asegurarse de que siempre esté disponible una copia actualizada de todos los documentos en diversas ubicaciones. Si un desastre ocurre, todo estará fácil e inmediatamente accesible para quiénes tengan que actuar.