Hadoop: IBM lo hace más amigable para los desarrolladores

Mucho se habla de Hadoop y Big Data. Y también son varios los proveedores que proclaman las bondades que tienen sus plataformas para la implementación de esta tecnología que permite procesar en forma eficiente altísimos volúmenes de datos.

IBM, que no es de las empresas que más comunican sobre este tema (en Argentina al menos), resulta ser según un estudio realizado entre más de un millar de grandes desarrolladores, la empresa que mejores resultados ha logrado en cuanto a facilitar el trabajo con entornos Hadoop.

El estudio realizado por Evans Data Corporation mostró que IBM ha logrado grandes avances en cuanto a que Hadoop resulte más accesible, escalable y confiable para los desarrolladores de aplicaciones.

La encuesta efectuada por esa firma encontró que IBM lidera en el espacio de los desarrolladores, con más de un 25% de los entrevistados identificando a la de IBM, como a su principal distribución a utilizar. La encuesta también puso foco en ciertas áreas en crecimiento como las de aprendizaje de máquinas y analíticos de streams de datos. Allí, un 18% de los desarrolladores mencionó a IBM InfoSphere Streams como a su aplicación favorita en aprendizaje de máquinas o “machine learning.” Esto colocó a IBM en el segundo lugar en cuanto a favoritismo en esta categoría.

Por otra parte, IBM también llevó a cabo un benchmark auditado por una firma independiente que en este caso fue InfoSizing. El benchmark apuntó a tres de las más populares implementaciones de SQL-on-Hadoop. Allí, IBM apareció como la única solución del conjunto capaz de procesar a todas las 99 clases de consultas Hadoop-DS(2) (Hadoop DS es un benchmark desarrollado por IBM y basado en el respetable TPC-DS, Transaction Processing Council Decision Support). De las tres participantes en el benchmark, IBM Big SQL fue considerada la más rápida, escalable y confiable. Su performance fue 3.6 veces superior procesando 46 consultas en un volumen de 10TB en comparación con las otras dos tenidas en cuenta, que fueron Cloudera Impala 1.4.1 y Hortonworks Hive 0.13.

“Nuestra plataforma para Hadoop contribuye a que las aplicaciones con datos intensivos puedan administrar y analizar petabytes de Big Data gracias a que ofrece un enfoque integrado para analíticos. De esa manera, les ayuda a convertir información en algo internalizable (insight).” Así lo declaró Beth Smith, gerente general de plataformas analíticas en IBM. “Tanto este nuevo informe como el benchmark son prueba de que los clientes pueden realizar consultas cada vez más complejas y tener resultados para el negocio más velozmente. Realmente obtienen un excelente retorno de sus inversiones en la plataforma Big Data de IBM,” agregó.

IBM también se ha mostrado muy activa en lo que hace a la capacitación que facilite la transición hacia la explotación de Hadoop. Más de 200.000 desarrolladores utilizan el sitio educativo online Big Data University y experimentan con usuarios nuevos y experimentados en Hadoop, Big Data y DB2. Miles de desarrolladores, según IBM, también participan en los encuentros sobre Big Data que IBM realiza en todo el mundo. Esos encuentros son gratuitos y los desarrolladores tienen oportunidad de aprender y experimentar sobre Hadoop, SQL-on-Hadoop y otras tecnologías relacionadas con Big Data.

Por otra parte, IBM ha implementado un portafolio de servicios dentro de Bluemix. Esos servicios atienden a la creciente demanda de explotación de datos en entornos mobile, IoT (Internet of Things) y aplicaciones Web. Servicios de datos y analíticos como BigInsights on Cloud, Cloudant, dashDB DataWorks, Embeddable Reporting, Geospacial Analytics, Mobile Data y la base de datos Timeseries, permiten que los desarrolladores puedan crear más aplicaciones cruciales para los negocios y puedan anticiparse así las necesidades de clientes para la optimización de las operaciones en tiempo real.