Datos almacenados en cintas: un futuro movido

27 Sep 2004 en Storage

Mucha de esa información que guardamos en cintas preparadas, en teoría, para durar 30 años, jamás verá la luz nuevamente. Pero también existen datos cuya salud deberemos comprobar a lo largo de los futuros años. “Vamos a guardar esta información en cinta y la migraremos dentro de 15 años, que es la mitad de su vida útil,” han dicho muchos directivos de grandes organizaciones que, por ejemplo, tienen archivos digitales de grandes masas de datos analógicos a los que piensan digitalizar algún día. El problema es que no siempre se puede tomar un drive de cinta que tiene 20 años, con datos que también tienen 20 años y leer la cinta para migrarla en un nuevo tipo de medio.
Hace 20 años IBM lanzó su cartridge 3480 y, si alguien grabó datos desde un mainframe funcionando con MVS, es muy probable que sea capaz de leer esa información hoy. Pero si los datos se fueron guardando en otras arquitecturas y sistemas operativos ¿Se los podrá leer hoy? A lo mejor sí, pero no es muy probable. Aun si se pudiesen leer, podría ser muy costoso.
La comparación con los ambientes mainframes responde a que son entornos que cambian evolutivamente y no revolucionariamente. La tecnología mainframe es compatible “hacia atrás” por mucho más tiempo que la de Unix, Windows, etc.
Mucho se ha estudiado la tasa de errores recuperados y no recuperados en el trabajo en discos SCSI o SATA dentro de un determinado hardware. Ahora, además del comportamiento dentro del hardware servidor, debemos contemplar al que ocurre en la red y a las tasas de errores de bits en Fibre Channel, por ejemplo, y demás aspectos que hacen a una confiabilidad de los datos end-to-end. En este plano están surgiendo estándares que utilizan un check digit o checksum de 8 bytes entre la tarjeta HBA (Host Bus Adapter, en Fibre Channel) y el dispositivo de almacenamiento. Para mayor información, visiten www.t10.org.
Las cintas duran 30 años debidamente almacenadas. Si se mantienen en perfectas condiciones de temperatura, humedad y limpieza, sería posible leer a la mayoría o a todos los datos después de ese período. Lo que ocurre si las condiciones ideales se suspenden, queda en manos de la suerte.
El formato es otro de los problemas. Las cintas y los drives (con excepción de algunos proveedores como StorageTek) no son compatibles por mucho tiempo. En general, los ciclos son de cinco años. En pocos años tuvimos una gran cantidad de cambios en interfases de hardwre: IPI, SCSI-WD, SCSI-FW, Ultra-SCSI, Ultra160-SCSI, FC-AL, FC-Fabric 1GB, FC-Fabric 2GB, y pronto, FC Fabric 4GB ¿Qué sistema operativo seguirá soportando eternamente a interfases que ya no se usan?
Los formatos de datos que utilizan las aplicaciones también cambian con el tiempo. Sólo intenten usar un documento creado con Word 1.0 o una versión vieja de WordPerfect o Excel en alguna otra aplicación. Algunos formatos, como Adobe PDF garantizan compatibilidad por 30 años, pero otros formatos no. Si se migran los datos de un formato de cinta a otro, tendremos la oportunidad de actualizar también el formato de la aplicación y eso puede ser una buena idea considerando la frecuencia con la que cambian.
Las cintas tienen ventajas sobre el almacenamiento en disco en el largo plazo, pero esas ventajas traen consigo el requerimiento de la migración. Al largo plazo, nadie puede jurar que las interfases de discos no tengan el mismo problema de migración. Hace diez años se usaban dispositivos RAID con SCSI-FW y es posible que hoy el driver esté en muchos sistemas operativos, pero ¿Será posible montar un file system adecuado? Ya se trate de disco o cinta, siempre habrá que tener en cuenta la migración.
Algunos consejos: Averiguar el tiempo que será soportada la tecnología que se está usando. Analizar los costos, incluyendo el de tiempo y personal, de lo que hará falta migrar. Estudie o contrate consultoría para entender bien las tecnologías disponibles y los caminos de migración y upgrade correspondientes.
Antes de crear el plan para una organización, es necesario determinar qué tecnologías satisfacen los requerimientos de costo, longevidad y confiabilidad. Si algún proveedor le promete compatibilidad hacia el futuro, verifique lo que hizo en los últimos años para saber si cumple con sus promesas.
Por último, es necesario ver a la migración como a una parte de la vida de la información, sea en cinta o disco. Con el próximo advenimiento del estándar T 10 OSD (Object Storage Device, la migración de file systems será inevitable. Sea que se use discos o cintas (que siguen siendo más económicas para el almacenamiento a largo plazo), la migración deberá ser parte del plan.