2010: Mayor demanda de capacidad y velocidad de los warehouses de datos

29 Dic 2009 en Software

Una creciente marea de datos, el encogimiento de las ventanas de análisis y prespuestos reducidos para IT, equivalen a decir que los warehouses de datos empresariales (EDW, por Enterprise Data Warehouses) tendrán que ser más grandes, más ágiles, más veloces y más económicos en su costo de implantación. No sorprenderá que las warehouses de datos alcancen escalas de petabytes en operaciones centradas en la Web, por ejemplo. Los EDW tendrán que ser más ágiles porque las compañías las usan cada vez más como soporte en la toma de decisiones del día-a-día operacional. Y eso implica convertir a los clásicos procesos batch ETL (Extraction, Transformation, Load) en una latencia en tiempo real.
Ganar en volumen y velocidad no siempre significa tener que invertir en una infraestructura de hardware más grande y compleja. La alternativa estará en los modelos de administración de datos tales como MapReduce, por ejemplo, que comenzarán a ser puestos a prueba en entornos analíticos con enormes volúmenes de información. Innovaciones en los sistemas de bases de datos (DBMS) en cuanto a procesamiento en memoria, aprovechamiento del paralelismo y opciones de almacenamiento columnar, permitirán que los analíticos de volúmenes masivos de datos lleguen a una mayor audiencia con precios antes no imaginables.
Por otra parte, las soluciones de integración de datos basadas en SaaS (Software as a Service) y entornos cloud, ofrecerán la oportunidad de bajar aún más los costos de capital en la infraestructura pasando esta complejidad y desorden a manos de proveedores externos. Según la firma investigadora del mercado de IT, Ovum, veremos cada vez a más compañías apelando a la nube como camino sin riesgo de prototipos e ingreso al uso de warehouses y datamarts en analíticos. Esto, siempre según Ovum, será sólo en aplicaciones BI que resulten razonables como caso de negocio. No es de esperar que las EDWs sean movidas a las nubes enteramente en una etapa cercana.
Por último, crecería la aceptación de appliances o dispositivos (soluciones preempaquetadas de software y hardware) con los que el cliente evitará las complicaciones y costos del ensamblado y ajuste de todas las piezas que componen una solución de esta clase. Algunas de estas soluciones pueden ser demasiado propietarias y dado que su funcionalidad es integrable a otras etapas de la infraestructura de IT, las empresas deberían considerar esa naturaleza propietaria en cuanto a su impacto tanto en el front-end, como en el back-end.