Enlaces accesibilidad

Google acumula más y más datos y conocimientos para poder responderlo todo

  • Su 'Knowledge Vault' acumula miles de millones de datos y "hechos"
  • Lo hace utilizando el aprendizaje automático y robots de internet
  • El objetivo es obtener respuestas fiables sobre el mundo que nos rodea

Por
Libros en los estantes de una biblioteca
Libros en los estantes de una biblioteca

Un trabajo hecho público recientemente bajo el título "Una aproximación a escala de la Web sobre la fusión de conocimientos probabilísticos" ha dado a conocer algunos detalles más sobre el Knowledge Vault o Baúl del conocimiento en que está trabajando Google: un buen nombre para lo que califican de "el mayor repositorio de información estructurada del planeta".

Esta gigantesca montaña de conocimientos incorpora técnicas como las bases de datos masivas, el aprendizaje automático, el lenguaje natural (con el que entender las relaciones existentes entre todo tipo de objetos y datos) y la más vasta colección de "hechos" conocida hasta la fecha.Estos "hechos" son datos comprobados por la información disponible en la Web, además de otras bases de datos específicas.

A cada uno de esos hechos se le asigna una probabilidad, y cuando muchos de ellos se van sumando la probabilidad de certeza también aumenta. Cuando supera el 90 por ciento se puede hablar de que son datos fiables – aunque casi siempre se basen en una probabilidad y no en certezas matemáticas o lógicas.

Que Madrid es la capital de España puede que sea probable al 99%, quedando el 1% restante para casos como si el contexto fuera una pregunta que se refiere al antiguo imperio cuando Toledo era la capital, a la ciudad de 200 habitantes de Nuevo México también llamada Madrid (en Estados Unidos) o excepciones por el estilo.

Esta colección de hechos e informaciones se utiliza ya con éxito en otras áreas, tales como la búsqueda de contenidos o la traducción automática. Es en cierto modo un "saber colectivo" de todo lo que existe publicado en Internet y en libros y otras bases de datos que Google está añadiendo a su Knowledge Vault. ¿Y cómo se añade? Mediante robots especializados que se encargan de rastrear, recopilar la información y añadirla cuidadosamente.

A día de hoy, tal y como se explica en New Scientist la base de datos cuenta con 1.600 millones de hechos, de los que 271 pasarían la prueba como "hechos ciertos" (con una probabilidad mayor que el 90%). El resto de compañías tecnológicas de primera línea, como Amazon, IBM, Facebook o Microsoft, también están construyendo sus propias versiones de estos sistemas.

Y es que cuando se trata de Google hay que pensar llevando las ideas un orden de magnitud más allá. Recientemente se dio a conocer, por ejemplo, que los coches autónomos de Google tenían "truco" y que contaban con una versión especial de Google Maps aplicable a las ciudades por las que circulan, con detalles tan ínfimos que resultaban increíbles: las distancias entre carriles, las alturas de los bordillos o la posición de cada semáforo y señal de tráfico – incluyendo su altura por si eso pudiera causar una colisión. En otras palabras: Google permite usar la versión pública de los Mapas Google a cualquiera, pero en sus laboratorios se trabaja ya con mapas diez o cien veces más precisos y detallados: con resolución de unos pocos centímetros y cientos de veces más información.

Con toda esta información parece claro que el gigante de Internet sigue desarrollando ideas a toda marcha y que lo que vemos apenas roza la superficie, en el caso de las búsquedas la tradicional caja en la que buscamos algunas palabras. En una década, dicen los expertos, se les podrá preguntar a los motores de búsqueda por cuestiones más relevantes de modo que obtengamos las respuestas exactas; también puede que contemos con asistentes y sistemas automáticas que elijan por nosotros cuales son los diez correos más importantes que hemos recibido durante el día o cuál es la mejor forma de tratar una enfermedad según los expertos.

[Se puede consultar el trabajo original respecto al Knowledge Vault en Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion, PDF.]