IBM Watson, un nuevo paso hacia el conocimiento y el descubrimiento

IBM - Jorge Mujica, Chief Technology Officer

Datamation entrevistó a Jorge Mujica, Chief Technology Officer de IBM a cargo del Proyecto Watson en nuestra región. Nuestro objetivo es informar el estado actual y el potencial de esta propuesta tecnológica en la que los usuarios no son tecnólogos, sino especialistas en la exploración y utilización del conocimiento que se logra a través de los datos de todo tipo.

Iniciando la entrevista, Mujica nos muestra un ejemplo de aplicación de la tecnología que IBM ha combinado en Watson. La interfaz de su computadora exhibe un mapamundi en el que se ven puntos rojos representando, en tiempo real, actividad de twits emitidos por argentinos de todo el mundo opinando sobre el país. Muchos de esos puntos están en lugares remotos, mostrando una característica de los argentinos: se exteriorizan más cuando viajan.

 

“Este es un ejemplo de Watson y su inteligencia artificial. Hemos hecho esta experiencia en español argentino y hasta algo de lunfardo, que fue toda una experiencia, lo debo decir. Lo interesante es que Watson va aprendiendo palabras nuevas. Comenzamos con un español neutro y luego fuimos recorriendo los países, sector por sector, cargando palabras específicas incorporando conceptos asociados al lenguaje para poder lograr un sentimiento positivo, negativo o neutral sobre el concepto que uno quiera. Argentina y Venezuela son hoy los dos países de América Latina con mayor actividad de los ciudadanos en las redes y se ven comentarios muy interesantes, tanto sobre los países como en otros sentidos. Este fue el primer caso de Watson aplicado en Sudamérica en un contexto en español y realmente es muy interesante.

 

Diferencia entre la parte analítica y la cognitiva de Watson.

“Digamos que lo analítico responde a lo que hemos estado usando los últimos 25 años. Es donde el humano plantea un modelo. Por ejemplo, los bancos operan con colocaciones, etc, etc. Pero es un humano definiendo el modelo y se le cargan datos para que otro humano, un analista, pueda hacer conjeturas, inferencias.

Lo que es cognitivo es distinto. Deducimos el modelo a partir de los datos. Dejamos que una máquina, particularmente con las llamadas heurísticas, una serie de algoritmos internos, explore los datos, detecte patrones inusuales que normalmente un humano no va a apreciar y así define o propone un modelo diferente. Esto tiene sentido toda vez que se tengan muchos datos, como ocurre en el momento que hoy vivimos.

 

¿Datos on premise?

IBM trabaja con lo que llamamos privacidad por diseño. Se diseñan sistemas que no dependen de lo existente, sino que tienen una configuración de privacidad. Eso debería ser así en todos los sistemas de gobiernos, bancos y otras organizaciones.

En IBM estamos trabajando con nuestros clientes y asociados en general para definir ese concepto de privacidad. Lo diseñamos como si fuese un traje a medida y lo cargamos tanto en la nube como cuando se opera on-premise.

Hay limitaciones. Por ejemplo, en Chile los datos de salud no pueden salir de las fronteras. Eso nos confina a que los data centers tengan que estar dentro de las fronteras físicamente. No todos los países tienen esa restricción. Pasar de on-premise a cloud es un proceso en el que tanto Europa como los EE.UU nos llevan cinco años de ventaja.

 

Datamation Pregunta: hemos observado que cuando se trabaja con Watson y éste identifica patrones en base a lo que aprendió, no hay demasiadas herramientas para transparentar qué métodos siguió Watson y tampoco para distribuir ese modelo a otras áreas de la organización para su reutilización ¿Es esto así?

 

Mujica ha estudiado Inteligencia Artificial y obtuvo un Master en la materia. Sin embargo, promete “ser lo más simple posible en la respuesta a este punto. En lo que está en el campo de las máquinas de aprendizaje como las que utiliza Watson, existen dos corrientes: una es la del entrenamiento explícito, en la cual yo le doy las reglas para que la máquina aprenda. La otra corriente es la no determinista, donde aparecen las famosas redes neuronales. Estas redes neuronales son cajas negras que continuamente se van ajustando y a las que les vamos pasando impulsos de entrada y ellas van entregando impulsos de salida, pero no hay manera de ver el camino reverso, de saber cómo aprendió todas esas situaciones. Termina siendo muy eficaz, pero al mismo tiempo no es legible para un humano.

Aquí llegamos a un punto de cuidado, porque las máquinas de aprendizaje y Watson es eso, están hechas para apoyar la decisión humana y no para decidir por un humano. Es una barrera muy importante a entender en este punto. El humano siempre es el responsable de tomar la decisión. Con estos principios de aprendizaje, Watson lo que busca es ofrecer opciones que a un humano posiblemente no se le habrían ocurrido.

 

Debajo de toda información existen estructuras de datos. Cuando le preguntamos a Mujica qué es lo que IBM hace para esconder esa complejidad tecnológica y facilitar el trabajo de los usuarios finales, nos responde que “mucho más allá que el dominio tecnológico, lo que le proponemos a nuestros clientes y a todo el mundo es el concepto de Gobierno de Datos. Eso en forma independiente de la estructura de los datos; ya se trate de una transacción bancaria o de un twitter. El gobierno de datos es una práctica. De hecho, las universidades necesitan modernizar esa práctica para independizarla del problema de las bases de datos.”

 

Eso es lo que in IBM estamos potenciando, prosigue Mujica. Por sobre esta práctica de gobierno de datos vienen todas las tecnologías y en IBM las tenemos. Tenemos modelos columnares, tabulares (e incluso por filas) tenemos NoSQL en la nube, además de modelos cognitivos como el de Watson y la tecnología Hadoop. En Hadoop, IBM tiene su propia implementación llamada Big Insight y basada en el Apache Hadoop, a la que se han agregado elementos que simplifiquen el manejo tecnológico. Recuerden que Hadoop es altamente tecnológica. Hace falta una formación muy amplia para sacarle provecho y en IBM hemos tratado de acortar esa brecha. Con DataWorks se tiene un mix en el que se combinan datos estructurados y no estructurados en una misma caja.

 

Watson tiene conectores con Hadoop para poder traer los datos, pero no se ha implementado, por ejemplo, la posibilidad de hacer queries directamente desde ese entorno. Watson realiza un proceso llamado crawling, mediante el cual visita diferentes fuentes de datos, los trae, los relaciona y se queda con esos relacionamientos para poder trabajar desconectado de la red, como ocurrió con el famoso programa de TV Jeopardy.

 

Sectores donde Watson ya ha ofrecido resultados.

 

El cuidado de la salud es uno de los sectores donde ya se han logrado hitos importantes. “La primer aplicación que hicimos en el campo de la salud es con el cáncer gástrico. Creamos un sistema que se llama Watson Oncology. Lo que hicimos, en pocas palabras, fue cargarle todos los libros de medicina. Primero en inglés y ahora lo estamos haciendo en español. Lo primero que hicimos fue detectar patrones de la conducta de las personas. Por ejemplo, si yo todas las mañanas troto y tengo una determinada alimentación, se confronta con el contenido de esos miles de libros y me arrojará una probabilidad de que contraiga cáncer gástrico. Luego, propondrá un tratamiento para mitigar esa probabilidad. Esto se aplicó en tres clínicas de los EE.UU y ahora estamos en conversaciones para aplicarlo en Sudamérica.

Luego, trasladamos esa experiencia al contexto de los tumores cerebrales y estamos investigando dentro de una nueva unidad que se llama Watson Health y que es completamente nueva.

Y también han llegado al campo de la psicología. Mujica nos muestra un texto en el que una persona se puede autodefinir, un par de párrafos. En Watson se han cargado cientos de fuentes y tratados en los que se ha estudiado el significado que tiene la forma en la que un individuo se describe a sí mismo. Cuando le pido que analice, lo que Watson hace es tomar los significados semánticos de las palabras y me entrega un informe en el que me explica cómo es su personalidad en base a lo que se acaba de entregar. Se puede hacer, por ejemplo, con el contenido de los twitts y tener un diagrama de sentimientos. En Argentina tenemos un fenómeno muy interesante. Los argentinos cada vez twittean menos con palabras y más con fotos. Watson puede hacer un estudio de los objetos y circunstancias de las fotografías sumándolo a lo textual y entregar un mapa que puede resultar muy certero.

Todo esto, nos dice Mujica, abre un importante espacio en las industrias, ya que entender al cliente, al ser humano, al ciudadano, es justamente una de las claves del éxito o fracaso.

 

Le comentamos a Mujica acerca de los principios que muchos investigadores sostienen respecto a la generación de modelos basados en una excesiva cantidad de datos. Los estudios realizados muestran que, cuando se exploran enormes masas de datos en forma regresiva, existe una alta probabilidad de que los modelos resultantes asocien hasta un 30% de variables espurias.

 

“Desde hace muchos años hemos tenido proyectos de tecnología que trataron de emular al ser humano. Lo interesante de este momento es que la capacidad y la velocidad de la computación, nos permiten hacer realidad muchos modelos que antes eran en gran medida teóricos. Nos acercan más a hacerlos viables. La idea de tomar tres puntos en el espacio y predecir el futuro nos precede, desde la teoría de la relatividad o desde antes, incluso desde Newton. Efectivamente, como fenómeno no hay grandes cambios, pero hoy tenemos un apoyo en la capacidad tecnológica que nos permite comprobar o refutar un montón de hipótesis que podrían haber existido antes respecto a este tema. Yo creo que allí está el valor. De hecho, Watson no es nuestra máquina más potente. Si la comparo con nuestra máquina más potente, que se llama Sequoia, representa un 3 o 4% de su capacidad computacional, pero para nosotros, Watson es la máquina más útil. Aquí está el desafío, ya que por décadas nos dedicamos a hacer la máquina más potente. Ahora Watson es un sistema, una caja perfectamente afinada para su finalidad.

 

Esta es la primera vez que IBM está abriendo esta clase de tecnología. Watson es una secuela de lo que fue DeepBlue, sólo que DeepBlue fue un experimento cerrado o específico para ajedrez. Hoy lo estamos abriendo e incorporando conceptos como la singularidad a partir de Big Data en particular. Lo que estaba en papers de manera muy teórica, ahora se puede palpar como resultados.

 

La facilidad de uso as a service

Preguntamos si Watson compite con otras herramientas analíticas de la propia IBM, como Cognos, por ejemplo.

“Con Watson analíticos cargamos datos y dejamos que él deduzca el modelo, como dije antes. El modelo que arroja Watson y el que hizo el humano seguramente serán dispares y permiten que el analista actualice uno u otro. Se trata de un juego de deducción en el que la máquina me va apoyando como analista del negocio en el mejoramiento de los modelos que yo pueda tener. Esto no reemplaza ni compite con Cognos, por ejemplo. Es lo cognitivo complementando a lo analítico.”

Hay aplicaciones que son sólo en modo “as a service.” Por ejemplo, Watson Oncology no tiene un instalador que permita llevar la aplicación una máquina. Pero tenemos el core de Watson, que se llama Watson Explorer y que sí puedo instalar en el servidor de un cliente. Hay clientes que necesitan identificar patrones, explorar datos y no quieren sacar esos datos de su datacenter.

 

Las partes de Watson

Podríamos separarlo en cuatro tipos de Watson. Lo primero y más simple es Watson Explorer, que es el software. No tiene conocimiento, es sólo el software, lo cargo y lo instalo.

Luego, tenemos a las Watson Apps, que son las adaptaciones que hemos ido creando con este software en contextos específicos, como por ejemplo salud o viajes, en los que trabajamos actualmente. Los llamados advisors o engaements son los que nos ayudan con las Watson Apps.

A continuación tenemos un tercer nivel que es Watson Analytics y está pensado para el usuario del negocio, al que le cargo datos y me entrega un modelo. Es una jugada que consiste en poder analizar datos sin preocuparme de diseñar un modelo.

Por último, tenemos un cuarto tipo, que son lo que llamamos aplicaciones contemporáneas o complementarias. Por ejemplo, tenemos al “Chef Watson.” No le cargamos libros ni recetas, sino la estructura molecular de todos los alimentos conocidos del planeta. Lo que hace es, en lugar de buscar patrones de palabras, identificar armonía de ingredientes. En una escuela de Chefs le enseñamos a Watson la combinación de algunos ingredientes y, a partir de allí, Watson comenzó a generar sus propias recetas. Chef Watson ganó concursos de degustación compitiendo con destacados Chefs. Este cuarto dominio es lo que conocemos como Watson Creative.

Se está pensando en Watson Creative para música y otras funciones del bienestar humano.

 

Watson en Mobile

Estamos trabajando en algo que hemos llamado Ask Watson. Se trata de poder realizar consultas desde dispositivos móviles en texto libre y recibir una respuesta. Por ejemplo, hemos hecho aplicaciones comunitarias o solidarias. Cuando tienes algo que sobre en casa, puedes por ejemplo preguntar en lenguaje natural: ¿A quién le puedo regalar este par de zapatos?

Estamos avanzando en un ecosistema. Ya hemos superado los 200 proyectos en Blue Mix, nuestra plataforma de innovación como servicio en la que está incluido Watson en casi todos sus niveles. Más de un 50% ya está haciendo uso de esta herramienta, de la interfaz de consulta en lenguaje natural. Y eso se hace en forma sencilla.

Al margen de esa innovación que no controlamos ya que cualquiera puede crear una cuenta en BlueMix, tenemos un equipo de expertos en Latinoamérica que están revisando esos proyectos y seleccionando a los que tienen mayor potencial para poder invertir y ayudarlos.

 

Los rubros

Mujica nos dice que no han detectado algo en especial. Las redes sociales se destacan por el interés que despiertan, ya sean comunitarias, políticas u otros temas. El análisis de datos puros también está mostrando gran actividad.

 

La seguridad

Sabemos que los usuarios tienen sus niveles de seguridad, pero IBM no puede depender de eso. Toda la data que es transferida desde un punto cualquiera hacia Watson, está encriptada. Esta es la primera línea de seguridad mediante una clave de decriptación que se genera por sesión. No es la misma siempre. Y dentro de Watson, todos los datos están encriptados dos veces. Si alguien robara un disco duro de un servidor, no tendría nada para revisar. Luego, por encima, tenemos las medidas de seguridad que cada usuario pueda tener.

 

Watson en Verse

Verse es una plataforma de planificación y colaboración que busca optimizar la experiencia de comunicación entre las personas. Lo primero que hace Watson en Verse es aprender de la actividad de los usuarios. Desde los archivos y sus contenidos, hasta la manera en que alguien plantea reuniones a lo largo de las jornadas de trabajo. Con un esquema de positvo-negativo-neutral, puede ranquear la relación que se tiene con otras personas.

Incluso estamos apuntando a que Verse sea una plataforma que te aconseje y recomiende cómo manejar una determinada situación.

Además de la capacidad de aprendizaje, tenemos capacidades de interacción. Es tener un asistente virtual en el que tú hablas con Verse para hacerle preguntas como, por ejemplo ¿Cuántas reuniones tuve con X persona en los últimos tres meses? Eso, en lugar de perder tiempo buscando y consultado en lenguaje totalmente natural.

Otra capacidad es la de mezclar los datos de comunicaciones, con otros datos. Supongamos que tenemos un proyecto de desarrollo de software y está teniendo muchos problemas de bugs o errores ¿Cómo podría correlacionar ese comportamiento con la forma en la que el equipo se está comunicando? Es frecuente que exista una correlación entre la calidad de los entregables de un proyecto de esa clase y el comportamiento que va teniendo el equipo encargado de llevarlo adelante. Eventos como la reiteración de emails con reclamos y más. El Project manager puede hacer consultas. Metodologías como Devops, por ejemplo, no miden la variable de lo que podemos llamar sinergia social. Analizan la evolución del trabajo del equipo pero no lo que ocurre en el ecosistema social de los participantes porque no es una responsabilidad Devops. Ese es un punto que al combinarlo

 

Los metadatos

Le preguntamos a Mujica si Watson, en su función de aprendizaje, toma en cuenta los metadatos de aquellas estructuras de datos que los posean. La respuesta es que siempre tomará en cuenta esos metadatos si existen. Por ejemplo, cuando Watson busca en una planilla Excel con separación CSV o separado por comas, lo primero que Watson busca son las columnas que tiene el archivo, tengan o no datos. Trata de entender cuáles son los campos que conforman el archivo. Luego ve los datos para saber cuántos están completos y cuántos no.

Aquí volvemos al punto del gobierno de datos, que es la estrategia que debe imperar y en la que estamos de cierta forma tratando de reeducar a las organizaciones.

 

El factor humano

Hoy aparece el rol del CDO (Chief Data Officer) como una necesidad creciente para las organizaciones. No es un tema tecnológico, sino un problema de tener expertos en los modelos de datos que se manejan en la organización. Ese personaje está folclóricamente presente en las organizaciones, pero muchas veces no encontramos a un responsable de los datos. He conocido un banco en México donde hay un CDO y es impresionante ver la forma en que la empresa se ordena en términos de gobernación de sus datos.

El que no se hayan formado suficientes profesionales que puedan ser CDOs es una responsabilidad de los que actuamos en este segmento y también de las universidades. Hay una carencia respecto a la actualización de la academia en este estilo de profesión.

Por otra parte, tenemos a algunos profesionales cuya aptitud nos ha sorprendido y son los sociólogos. Los sociólogos están en una etapa que podemos llamar de resurgimiento a partir de toda la nueva data de la que disponen. Eso nos puede ayudar a explicar fenómenos sociales y es algo que llega a las grandes empresas. En dos bancos de Chile, estoy trabajando con sociólogos para entender cuáles son los intereses de las personas y así configurar ofertas y promociones mucho más acorde a ellos.

Un tercer grupo es el de los estadísticos y matemáticos, también biólogos. Cuando cursé el Magister en Big Data y preparación como CDO en el Instituto Prestige del MIT, muchos de mis compañeros eran sociólogos y biólogos. A ellos les resultan muy familiares casos como las teorías de Graph y otros principios matemáticos que antes eran muy teóricos. En Watson, digamos que un 70% de lo que se utiliza tiene que ver con los principios de Graph. Es interesante ver que, tanto los CDOs formados en post grados, como los sociólogos, los matemáticos y biólogos, no son personajes estrictamente tecnológicos. Watson es aplicación tecnológica, pero que se carga de un contexto no tecnológico.

Hoy estamos en una convergencia en la que estamos integrándonos mucho más que antes alrededor del trabajo en el conocimiento que en el trabajo de proceso. Y este es un fenómeno histórico que nunca se ha dado en los niveles en los que está ocurriendo ahora.