Cargando...
RTVE Grafo es el Grafo de Conocimiento operable de RTVE
El grafo de conocimiento de RTVE
El hecho de que las ontologías sean un modelo de representación del conocimiento independiente de cualquier sistema es lo que hace posible representar y consolidar los datos de sistemas diversos y heterogéneos en un grafo de conocimiento. RTVE Grafo es una estructura avanzada de datos que organiza y relaciona información de manera más intuitiva y eficaz. Este grafo ha sido poblado con los contenidos de RTVE Play, lo que permite una mejor organización y acceso a la vasta cantidad de material audiovisual de RTVE.
El Grafo de Conocimiento de RTVE, RTVE Grafo, es un sistema de representación del conjunto de sus contenidos y recursos digitales que entiende hechos relacionados con los programas, contenidos audiovisuales, temporadas, géneros, temas, así como cualquier objeto potencialmente enlazado con ellos. Cuando decimos que es un sistema que “entiende” debemos asumir que es un sistema escrito en un lenguaje técnico que posibilita que las máquinas o sistemas “comprendan” y traten correctamente el conjunto de entidades al que nos hemos referido para, de ese modo, colaborar con las personas en sus procesos de interrogación, recuperación de la información y descubrimiento de conocimiento.
Anotación semántica y poblado del grafo de RTVE
Probablemente, el resultado más destacado y de más largo alcance del presente proyecto digital ha sido la consolidación de los contenidos procedentes de la Radio y Televisión Pública Española en un gran grafo de conocimiento unificado, extensible, expresivo e interrogable por máquinas y personas facilita el que los usuarios puedan recuperar esos recursos en función de cualquier interés o intención.
Para la consolidación de todos los datos de RTVE Play en el grafo de conocimiento unificado ha sido preciso diseñar y desarrollar un proceso de sincronización que recolecta en línea los datos de los sistemas de RTVE y los anota semánticamente según la ontología basada en EBUCorePlus definida y vocabularios de términos adoptados (como es el caso de ESCORT 2007 - EBU System of Classification Of Radio and Television Programs), representándolos en forma de tripletas (oraciones predicativas con la forma sujeto+predicado+objeto) y depositándolos en el almacén semántico (base de datos de grafos) que está en el corazón de la nueva plataforma de IA semántica de RTVE.
Para la correcta anotación semántica ha sido preciso realizar un alineamiento de datos de los contenidos existentes en las bases de datos de RTVE con las clases y atributos definidas en la ontología de RTVE y en algunos casos mejorar el metadatado de dichos contenidos en los sistemas de origen. Un objetivo crucial del proyecto RTVE Grafo era mejorar dicho metadatado, es decir, la forma en que se etiquetan y describen los contenidos de RTVE. Un metadatado más preciso y detallado facilita la búsqueda y el acceso a la información. Desde un punto de vista interno, el proyecto pretendía, por tanto, desarrollar un sistema afinado de anotación y representación semántica de contenidos que acortara la distancia entre RTVE y el conjunto variado de audiencias a las que una institución pública ha de dirigirse y para las que ha de hablar. Para ello y más allá de su uso público. RTVE Grafo se utiliza para anotar, organizar y presentar la información de un modo significativo, acopiando, por ejemplo, en la ficha de cada contenido toda la información relevante relacionada con ella.
El grafo de conocimiento de RTVE integra unos 2.000.000 de recursos digitales, 26 millones de entidades, unos 85 millones de relaciones entre esos diferentes objetos y entidades, y 167 millones de triples, que se utilizan para entender el significado del término que el usuario introduce en la búsqueda; pero también para ofrecerle un sistema de exploración de la colección y, en general, de todos los recursos, basado en un buscador facetado, entre otras utilidades, que le permite disponer de todos los posibles modos de navegación sobre ese conjunto de entidades. La ontología y el RTVE Grafo permitirá representar los contenidos de un modo más preciso, detallado, exhaustivo y expresivo, y facilitará formas de relación entre los usuarios y los mismos de manera más natural y conversacional.
En definitiva, la explotación de un grafo de conocimiento de estas características hará posible en el futuro hibridarlo con otras tecnologías de inteligencia artificial con el fin de desarrollar servicios avanzados para diferentes grupos de usuarios Este modo nuevo de estar presente en la Web pretende, en suma, crear y utilizar de un modo intensivo y eficaz la base de conocimiento del patrimonio audiovisual español.
Los grafos de conocimiento representan la estructura de la realidad y el modo de operación de nuestra cognición
RTVE Grafo quiere resultar útil a las personas y a sus demandas de conocimiento expresadas a través de sus procesos de interrogación. Para ello, el proyecto ha transformado los datos y conocimientos masivos de RTVE Play en respuestas rápidas y precisas a preguntas complejas en un escenario que asume la necesidad de que las respuestas sean explicables, utilizando, para ello, inteligencia artificial basada en la emulación de un razonamiento similar al humano (razonamiento semántico) operada con la tecnología de grafos de conocimiento de alto rendimiento.
El grafo de conocimiento de RTVE Grafo está operado por IA para algunos propósitos específicos, como el de unificación de los tesauros del Archivo RTVE, proyecto clave para el enriquecimiento del metadatado de sus contenidos.