Informe especial: La situación actual de CDP, el camino hacia el Back-up “ideal”

18 Ene 2006 en Storage

La esencial pero siempre poco atendida actividad que representa el back-up tiene hoy como concepto de punta a CDP (Continuous Data Protection). Al espacio de CDP, antes poblado por pequeñas empresas o start-ups, se han sumado durante el 2005 grandes compañías como EMC, HP, IBM, Microsoft y Symantec.
Se han producido anuncios de productos y también se ha formado un grupo especial de interés en SNIA (Storage Networking Industry Association.)
Es de esperar que durante 2006 esta tecnología se haga más accesible para los departamentos de IT empresariales y que los proveedores aumenten la visibilidad de la misma con nuevos productos.
Como ocurre con toda nueva tecnología, CDP es usada con diferentes significados o interpretaciones de las que surgen productos radicalmente distintos. A esta altura nadie puede predecir cuál será el criterio que se impondrá en la integración de CDP tanto con las aplicaciones que protege, como con otras tecnologías de almacenamiento.
Definición de CDP
Definir CDP no es nada sencillo, al menos hasta hoy, dado que el término ha sido incorporado con diferentes criterios, especialmente en lo que hace a su componente “continuo” (en Continuous Data Protection o CDP). ¿Acaso “continuo” es la capacidad de recuperar información partiendo de puntos arbitrarios dentro de un ciclo también continuo? ¿Es ésta una característica definitoria de CDP?
SNIA nos brinda la siguiente definición de CDP, por ahora la única “oficial”:
“CDP es una metodología que, en forma continuada, captura y da seguimiento a modificaciones de datos para almacenar los cambios en forma independiente a la de los datos originales o principales. De esta forma, permite establecer puntos de recuperación desde cualquier punto del tiempo ya transcurrido. Los sistemas CDP pueden funcionar en base a bloques, archivos o aplicaciones y pueden ofrecer fina granularidad de obejtos restaurables de una cantidad infinitamente variable de puntos de recuperación.”
Hablar de una cantidad infinitamente variable de puntos de recuperación aparece como opuesto a los puntos de recuperación fijos.
El término CDP también ha sido utilizado en forma más amplia para referir tanto a productos que admiten la restauración con el nivel granular de una operación de escritura, como a productos que ofrecen restauración basándose en puntos preestablecidos en el tiempo.
Los dos mayores exponentes de la segunda de estas variantes son Backup Exec 10d de Symantec y Data Protection Manager (DPM) de Microsoft, ofreciendo lo que Microsoft ha denominado “near-continuous data protection.” (Protección casi-continua de datos). Cada una de estas variantes registra y replica cambios continuamente, aunque hace un snapshot de los datos en el servidor sólo en intervalos de una hora, de modo que los datos históricos están disponibles únicamente en dichos incrementos.
Según un análisis realizado por Enterprise Strategy Group, los clientes están algo confundidos sobre la diferencia que existe entre las soluciones de snapshot y CDP. Para esta firma analista, cada concepto tiene su misión: Snapshot es para la replicación de aplicaciones de menor misión crítica que pueden tolerar una pequeña ventana de pérdida de datos, mientras que un verdadero CDP es para aplicaciones donde se requiere un RPO (Recovery Point Objective) igual o muy aproximado a cero.
El problema se origina en que se trata de agrupar al concepto bajo dos diferentes segmentos. Las soluciones de replicación y snapshot no proveen puntos de recuperación arbitrarios y están diseñadas para solucionar problemas generales de backup y recuperación a niveles departamentales o en empresas de mediano porte. En cambio, un verdadero CDP apunta a ofrecer cero pérdida de datos para determinadas aplicaciones de misión crítica a nivel de toda la empresa.
“Algunos dicen que es necesario poder ser capaz de retroceder a cualquier punto arbitrario en el tiempo,” nos dice Michael Parker, ejecutivo del área de marketing en Symantec. “De nuestras conversaciones con usuarios del mercado intermedio, surge que eso no es exactamente lo que buscan.” En el mercado de la organización mediana, los productos CDP ofrecen backups automatizados y regulares que pueden ser parte de un cambio hacia una estrategia general de disco-a-disco-a-cinta. Para estos clientes, nos dice Parker, “La naturaleza de la protección de sus datos está cambiando. La gente está reconsiderando su forma de hacer backup.”
La brecha entre el ruido y la realidad
Se habla mucho de CDP, pero hasta el momento las implantaciones han sido limitadas a nivel de empresa. No se ven implementaciones completas a través de toda la infraestructura de aplicaciones.
Mendocino Software es una de las empresas nuevas que ha logrado algunos éxitos en CDP mediante su software que trabaja a nivel de bloques y que es revendido por empresas como EMC y HP. Eric Burgener, VP de Mendocino, coincide en que el mercado está en un estadio muy temprano de adopción con CDP. “Se hacen muchas pruebas pero no hay implementaciones a nivel empresa. La mayor parte de lo construido es en organizaciones de menor nivel.”
Revivio es otra empresa que ofrece software CDP a nivel de bloque. Para su VP, Kirby Wadsworth, el mercado está completando su fase de educación y comienza a moverse hacia la compra de soluciones concretas. “Estamos notando un despegue en la adopción por parte de los clientes.”
Cuando se trata de CDP para aplicaciones específicas, los responsables de la administración del backup de algunas aplicaciones problemáticas como Exchange, por ejemplo, están al tanto de lo que es esta tecnología, ya que viven buscando nuevas soluciones. Es por eso que la gente no dice “quiero CDP” sino “quiero una solución efectiva para eliminar los problemas de backup con Exchange y quisiera poder usar esos datos de backup para poder hacer otras cosas como búsquedas en datos históricos.”
La actividad en el nuevo segmento CDP
En realidad un sub-segmento de la administración del almacenamiento de los datos, CDP se ha recalentado gracias a la entrada de IBM con su software CDP a nivel archivos; de ofertas basadas en bloques de HP y EMC; y las de snapshot y replicación por parte de Microsoft y Symantec.
EMC, compañía que ha licenciado tecnología CDP de Mendocino, está por su parte creando una completa plataforma de recuperación a partir de dicha tecnología y luego agregará integración con administración y aplicaciones. Rob Emsley, director de marketing de productos en EMC Software nos dice: “Lo que hacemos es integrar al motor RecoverPoint y a los drivers de host RecoverPoint en el producto Replication Manager. Así tenemos integración con la interfaz de administración y la aplicación.” La integración con aplicaciones agrega un valor significativo y queda claro que EMC no está únicamente poniendo su marca en productos Mendocino.”
Wadsworth, de Revivio, prevé importantes anuncios por parte de todos los principales proveedores de soluciones de storage en la primer parte de este año y una competencia intensa para finales del año. “Es algo nuevo, entusiasma y tiene capacidad de agregar mucho valor. Habrá mucho ruido para finales de este año.”
Respecto a las startups, hay quienes piensan que se favorecerán con el crecimiento en CDP de parte de las grandes empresas como EMC. Otros, en cambio, creen que los grandes proveedores desplazarán a esas nuevas empresas especializadas. Burgener, de Mendocino, destaca que su empresa tomó el camino de los OEMs ante su imposibilidad de llegar directamente a las grandes empresas usuarias con productos de infraestructura. Ahora, con EMC, HP, IBM, Sun, HDS, Microsoft, Veritas (Symantec), Cisco y Brocade, de las cuales cinco ya se mueven en CDP, “la gente de las grandes empresas querrá comprar sus soluciones de infraestructura de almacenamiento a alguno de esos grandes proveedores,” agrega Burgener.
El camino hacia la integración
La llegada de los grandes nombres ha impulsado a una naciente tendencia en CDP, la de
Profundizar la integración de aplicaciones con tecnologías CDP de bajo nivel orientadas a bloques. La relación EMC-Mendocino puede ser uno de sus catalizadores, ya que EMC está en condiciones de presionar a los desarrolladores de aplicaciones para que trabajen con el concepto de CDP, algo que todavía no han comenzado a hacer.
Mendocino ha comunicado que durante 2006 desarrollará plug-ins específicos para aplicaciones.
Algunos observadores del segmento creen que se necesitará algo más que la integración ya en marcha a nivel bloques con las aplicaciones con CDP. Las soluciones para aplicaciones no sólo tienen que tener en cuenta a la naturaleza de cada una de ellas, sino que deben tener inteligencia al integrarse con esas aplicaciones.
Una compañía prestadora de servicios ASP de California, utiliza CDP para restaurar objetos de aplicaciones (un mailbox por ejemplo), cuando se producen fallas importantes y ha llegado a la conclusión de que el 90% de las situaciones de fallo requieren de la restauración de objetos con un nivel de granularidad muy fino.
Wadsworth, de Revivio, nos informó que uno de los grandes objetivos de su empresa es una mayor integración con productos ILM (Information Lifecycle Management). “Hacia finales de este año y durante el siguiente, veremos soluciones que integran ILM y CDP y donde CDP literalmente alimenta a la infraestructura de ILM. Todo lo que se maneja a través de niveles CDP permite aplicar políticas a los datos sin impactar el flujo online de dichos datos. Es allí donde creo que se comienza a ver el verdadero poder de todo esto. No sólo en la recuperación instantánea o sus componentes DR (Data Recovery), sino en la integración de largo aliento en ILM.”
Para el futuro de CDP, Burgener ve un escenario donde la tecnología será muy usada, aunque sólo en las aplicaciones más críticas. “Si CDP resulta exitosa desde el ángulo de la industria de IT, lo que veremos en dos o tres años será a entre un diez a quince por ciento de las aplicaciones corporativas apoyándose en CDP.”
Algunos ven en la capacidad de captura de datos de CDP pasando a formar parte de la infraestructura de información empresarial. Esto puede ocurrir a nivel del mismo sistema operativo de parte de alguien como Microsoft o bien desde adentro de un subsistema de discos, en el controlador de un arreglo o en un controlador en red de arreglos de proveedores como EMC o Hitachi.
“La protección continua debería ser  un dispositivo presente en cualquier solución viable de protección de datos. Muchas de esas startups, creo francamente que serán adquiridas o desaparecerán porque la funcionalidad vendrá de soluciones de protección de datos más amplias,” nos dice Parker de Syamantec.
Finalmente, Emsley de EMC nos dice que “uno de los problemas para los desarrolladores de tecnología CDP es que no tienen mucha relación directa con la infraestructura existente en los clientes. El proveedor que ofrezca CDP como componente integrado de sus soluciones integrales de recuperación, tendrá más éxito.”