Llega Google Search Appliance

11 Ago 2014 en Servidores

Este dispositivo de búsqueda intraorganizacional ha revolucionado la productividad en grandes empresas. En Argentina será comercializado e integrado por la firma Latinware. Google Search Appliance, al igual que otros appliances, funciona como un servidor dentro o fuera de la red corporativa. Indexa contenidos críticos haciendo un recorrido o “crawling” de los recursos de la compañía o sitios Web públicos, para detectar datos que los usuarios necesitan ubicar. Utiliza los mismos métodos que se ofrecen en Google Search.

Esto quiere decir sitios Web, hosts de archivos compartido y bases de datos. Es posible configurar el tipo de datos y su ubicación para que sólo puedan ser vistos por los usuarios aquellos contenidos que son apropiados. Los administradores o gerentes pueden ver reportes que indican el uso que los empleados de la firma dan al appliance. La operación de configurar qué sitios (URLs) pueden ser visitados, los depósitos de archivos y bases de datos que el crawl puede recorrer, es muy sencilla.

Se trata de un servidor que se convierte en el exitoso sucesor de una experiencia que Google discontinuó en 2011, “Google Desktop.” Google Desktop fue diseñado para permitir búsquedas de documentos locales en forma similar a la que opera Google Search en la Web. Ofrecía integración con otros productos de Google como Gmail y Talk. Usando sus capacidades de caché, permitía trabajar con el email estando offline. En el uso del día a día mostró problemas de seguridad y vulnerabilidades explotables que Google superó con un nuevo release. Sin embargo, los problemas de privacidad que fueron aflorando incomodaron a los usuarios empresariales. Por ejemplo, las opciones por defecto de una versión guardaban archivos en servidores Google donde otros usuarios podrían acceder y así peligraba la confidencialidad de ciertos datos. Google Desktop salió del mercado en 2011, retirado por Google que argumentó como causa el dramático cambio que representaba el pasaje a la nube. Lo que sí quedó claro, fue que la capacidad de buscar y encontrar contenidos relevantes dentro de las empresas, es una propuesta para la que existe demanda. De hecho, existen varios programas que lo hacen, como Coveo, Attivio y Search. Pero la idea de Google fue entonces la de migrar de un concepto de aplicación desktop a uno de servidor: Google Search Appliance.

Los tipos de contenidos que se pueden indexar son muchos, decenas. Esto incluye a las extensiones más utilizadas como lo son .txt, .doc, htm/html, .rtf, .xls, .pdf, .dwg, .gif, .jpeg, .ppt, .msg, .wmf, etc. Por otra parte, debe destacarse que Google Search Appliance puede indexar también documentos antiguos tales como los de Lotus 1-2-3 o WordStar para DOS, lo cual realmente sorprende.

Para agilizar las búsquedas es bueno tener información sobre quién creó un documento, cuándo lo hizo y dónde reside. También es posible agregar palabras clave a los contenidos así es más fácil ubicarlos. Esta facilidad puede ser utilizada tanto por administradores como usuarios.

Los contenidos en servidores o sitios que conengan un archivo robot.txt en la raíz, no podrán ser indexados o explorados, ya que le indica al appliance que no puede indexar material en ese recurso. Es el mismo principio con el que se bloquea a Google Search en la Internet pública.

Existen dos versiones del appliance de Google. El G100 que puede indexar unos 20 millones de documentos y el G500 que puede llegar hasta 100 millones de documentos. Los appliances son modulars y pueden ir siendo agregados según se necesite o bien hacer primero un upgrade a G500.

El acceso a este recurso es igual que el que se utiliza para un servidor. Los usuarios se contectan por medio de la red usando un browser. La seguridad está respaldada por varios mecanismos que Google ha incluido en este appliance y por defecto no permite acceso público, sino que debe ser configurado. Además, hay que configurar las autenticaciones correspondientes a las diferentes ubicaciones. Se pueden configurar los requerimientos de autenticación para que los usuarios sólo puedan ver material al que actualmente tienen acceso y existen diferentes grados de permisos de seguridad. Por ejemplo, si se indexa a los archivos a compartir con permisos estrictos de seguridad, esos permisos rigen cuando los usuarios utilicen el Search Appliance en la búsqueda de datos. En síntesis, el Search Appliance no permite acceso no autorizado a material privado a menos que los permisos y restricciones establezcan excepciones.

El Search Appliance sólo almacenará los índices de los datos y no la copia de los mismos. De esa manera, si la caja del servidor fuera hurtada, vulnerada o dañada, no corren peligro los datos confidenciales de la organización.

El precio de Google Search Appliance depende de la cantidad de documentos, partiendo de un nivel de 500.000 documentos. No tenemos información sobre los precios actuales. Podrán encontrar más información en www.latinware.com y en http://www.google.com/enterprise/search/products/gsa.html.