Cargando...
RTVE-Grafo de un proyecto de
Interoperabilidad Semántica
Capítulo 01
Capítulo 01 Leer más
Estándares de representación del conocimiento
Capítulo 02
Capítulo 02 Leer más
Anotación semántica y poblado del grafo de RTVE
Capítulo 03
Capítulo 03 Leer más
El sistema de interrogación, búsqueda y recuperación
contextual de la información de RTVE Play
Capítulo 04
Capítulo 04 Leer más
Inteligencia Artificial Semántica capaz de operar
en un marco de ''sentido común'' con las personas
Capítulo 05
Capítulo 05 Leer más
RTVE son conversaciones
Capítulo 06
Capítulo 06 Leer más
El modelo ontológico de RTVE
Capítulo 07
Capítulo 07 Leer más
Un proyecto de Interoperabilidad Semántica
RTVE Grafo es un proyecto de interoperabilidad semántica que integra y enriquece contenido audiovisual con metadatos, facilitando el intercambio de datos y mejorando la experiencia del usuario mediante búsquedas contextuales y precisas.
RTVE-Grafo es un proyecto de Interoperabilidad Semántica
La plataforma técnica de RTVE Play se integra con múltiples sistemas, tanto internos como externos, incluyendo contenidos históricos del Archivo RTVE, así como lo último que RTVE produce y emite procedente de la producción propia o de adquisiciones.
La integración y consolidación de información de la producción audiovisual, tanto de vídeo como de audio, es un proceso complejo que requiere la contribución de terceros, la consolidación de múltiples fuentes de datos y, finalmente, el enriquecimiento con metadata para dotar al contenido de una información completa.
Con el fin de mejorar el intercambio y enriquecimiento de la información y la interoperabilidad de los datos, RTVE como miembro de la Unión Europea de Radiodifusión, Conocido por su acrónimo en inglés EBU/UER (UER) participa en procesos de estandarización de metadatos y en grupos específicos, como, por ejemplo, el grupo EBU-AIM, que gestiona y fomenta el uso de sistemas estándares de metadatado. Dentro de los trabajos de este grupo, RTVE adopta la ontología EBUCorePlus como ontología pivote para la construcción de un grafo de conocimiento a través del proyecto RTVE Grafo. EBUCorePlus es una ontología desarrollada por la UER para la representación de información de empresas y organizaciones de medios de comunicación, desarrollada como un proyecto de código abierto estrictamente semántico, cuya misión es la mejora de la interoperabilidad entre los sistemas.
La interoperabilidad semántica se define como la capacidad de los sistemas informáticos para intercambiar datos manteniendo un significado claro e inequívoco. Para la comprensión entre sistemas es fundamental que no solo los datos sean compartidos entre diversos sistemas o aplicaciones , sino también que éstos sean interpretables simbólicamente manteniendo el significado. En este contexto, RTVE lanza la iniciativa RTVE Grafo como
un proyecto de interoperabilidad semántica para el intercambio de información entre sistemas heterogéneos, para garantizar la capacidad de interpretación semántica de los datos que RTVE publica
Lo que simplificará el intercambio de información entre los sistemas de RTVE y con terceras partes y redundará en una integración y cooperación más efectiva, sencilla y semánticamente consciente entre los mismos.
RTVE Grafo no solo es un proyecto semántico para máquinas; es también, un proyecto sobre el que se crean servicios para las personas, con el objetivo de mejorar la experiencia de éstas cuando se relacionen con los contenidos y oferta de información y entretenimiento de RTVE.
RTVE Grafo hace posible generar modelos de interacción, interrogación y conversación entre las personas y las máquinas más sencillos, precisos, útiles e intuitivos, explotando las capacidades de inferencia y descubrimiento de conocimiento, lo que facilita la encontrabilidad del contenido.
En suma, RTVE Grafo posibilita crear utilidades para las personas mediante tecnologías semánticas avanzadas.
Estándares de representación del conocimiento
La adopción de estándares semánticos en RTVE Grafo mejora la interoperabilidad y el enriquecimiento de datos, creando un modelo de conocimiento adaptable al sector media español basado en prácticas europeas.
El marco ontológico de RTVE-Grafo: Estándares de representación del conocimiento y la ontología de RTVE
Estándares de representación del conocimiento
La adopción de estándares semánticos en RTVE ha permitido la mejora de la interoperabilidad interna y externa, facilitando el enlazado de datos y posibilitará el enriquecimiento de la información sobre la base de la vinculación e hibridación con otras ontologías de representación del contenido
El proyecto de RTVE Grafo buscaba implementar un estándar europeo en el sector media español. Como miembro UER; y partícipe en el grupo EBU-AIM, que gestiona y fomenta el uso de sistemas estándares de metadatado y específicamente EBUCorePlus, se acordó que fuera este el estándar utilizado, si bien adaptado a la idiosincrasia de la producción audiovisual de RTVE.
EBUCorePlus es una ontología para medios de comunicación, desarrollada por el Grupo de Trabajo de Modelado de Metadatos de la UER como un proyecto de código abierto, y es la continuación de dos ontologías de la UER: EBUCore y CCDM (Class Conceptual Data Model).
Las ontologías permiten a las máquinas reconocer las entidades del mundo y, en general, estructurar y organizar la información de manera simbólica y precisa, lo que a su vez posibilita un procesamiento de los datos más efectivo, a la par que permiten construir sistemas y aplicaciones más humanizados y útiles para las personas.
Así, una ontología es una representación formal de un conjunto de conceptos y sus relaciones dentro de un dominio de conocimiento escrita en un lenguaje técnico de programación comprensible por máquinas. En la práctica funciona para las máquinas como el sistema implícito de clases que utiliza la mente humana para identificar, distinguir y clasificar las entidades del mundo. La ontología que RTVE ha construido sobre EBUCorePlus para el proyecto RTVE Grafo define conceptos, junto con sus relaciones y propiedades e incluye axiomas que establecen reglas sobre estos conceptos. La ontología de RTVE utiliza lenguajes técnicos de programación y estándares establecidos por W3C como OWL y RDF, y resultará clave para su programa de inteligencia artificial y representación del conocimiento, así como para su participación en el programa de construcción de la web semántica y la Linked Open Data Web.
RTVE publica su ontología para que se pueda consultar la descripción detallada de cada una de las clases, relaciones y atributos que componen el dominio de conocimiento de RTVE Play. Esta web de documentación técnica permite consultar la descripción detallada de las clases y atributos de la ontología, su visualización en formato interactivo y su descarga en formato OWL.
https://www.rtve.es/grafo/ontologias/rtveplay/
Dada la posición de RTVE en el mercado audiovisual en España y en el ámbito del español, la adopción y localización de un estándar ontológico de referencia como es el caso de EBUCorePlus, ayudará a uniformar y mejorar la calidad y la interoperabilidad de los datos, no solo con el objetivo de mejorar la integración y el acceso a sus propios contenidos, sino con el de elevar los estándares de la industria audiovisual en España.
El Grafo de conocimiento
El Grafo de Conocimiento de RTVE es un sistema que estructura la información, entendiendo las relaciones existentes con los diferentes contenidos audiovisuales así como cualquier objeto potencialmente enlazado con ellos. Unifica los datos haciéndolos accesibles y comprensibles tanto para máquinas como para personas.
RTVE Grafo es el Grafo de Conocimiento operable de RTVE
El grafo de conocimiento de RTVE
El hecho de que las ontologías sean un modelo de representación del conocimiento independiente de cualquier sistema es lo que hace posible representar y consolidar los datos de sistemas diversos y heterogéneos en un grafo de conocimiento. RTVE Grafo es una estructura avanzada de datos que organiza y relaciona información de manera más intuitiva y eficaz. Este grafo ha sido poblado con los contenidos de RTVE Play, lo que permite una mejor organización y acceso a la vasta cantidad de material audiovisual de RTVE.
El Grafo de Conocimiento de RTVE, RTVE Grafo, es un sistema de representación del conjunto de sus contenidos y recursos digitales que entiende hechos relacionados con los programas, contenidos audiovisuales, temporadas, géneros, temas, así como cualquier objeto potencialmente enlazado con ellos. Cuando decimos que es un sistema que “entiende” debemos asumir que es un sistema escrito en un lenguaje técnico que posibilita que las máquinas o sistemas “comprendan” y traten correctamente el conjunto de entidades al que nos hemos referido para, de ese modo, colaborar con las personas en sus procesos de interrogación, recuperación de la información y descubrimiento de conocimiento.
Anotación semántica y poblado del grafo de RTVE
Probablemente, el resultado más destacado y de más largo alcance del presente proyecto digital ha sido la consolidación de los contenidos procedentes de la Radio y Televisión Pública Española en un gran grafo de conocimiento unificado, extensible, expresivo e interrogable por máquinas y personas facilita el que los usuarios puedan recuperar esos recursos en función de cualquier interés o intención.
Para la consolidación de todos los datos de RTVE Play en el grafo de conocimiento unificado ha sido preciso diseñar y desarrollar un proceso de sincronización que recolecta en línea los datos de los sistemas de RTVE y los anota semánticamente según la ontología basada en EBUCorePlus definida y vocabularios de términos adoptados (como es el caso de ESCORT 2007 - EBU System of Classification Of Radio and Television Programs), representándolos en forma de tripletas (oraciones predicativas con la forma sujeto+predicado+objeto) y depositándolos en el almacén semántico (base de datos de grafos) que está en el corazón de la nueva plataforma de IA semántica de RTVE.
Para la correcta anotación semántica ha sido preciso realizar un alineamiento de datos de los contenidos existentes en las bases de datos de RTVE con las clases y atributos definidas en la ontología de RTVE y en algunos casos mejorar el metadatado de dichos contenidos en los sistemas de origen. Un objetivo crucial del proyecto RTVE Grafo era mejorar dicho metadatado, es decir, la forma en que se etiquetan y describen los contenidos de RTVE. Un metadatado más preciso y detallado facilita la búsqueda y el acceso a la información. Desde un punto de vista interno, el proyecto pretendía, por tanto, desarrollar un sistema afinado de anotación y representación semántica de contenidos que acortara la distancia entre RTVE y el conjunto variado de audiencias a las que una institución pública ha de dirigirse y para las que ha de hablar. Para ello y más allá de su uso público. RTVE Grafo se utiliza para anotar, organizar y presentar la información de un modo significativo, acopiando, por ejemplo, en la ficha de cada contenido toda la información relevante relacionada con ella.
El grafo de conocimiento de RTVE integra unos 2.000.000 de recursos digitales, 26 millones de entidades, unos 85 millones de relaciones entre esos diferentes objetos y entidades, y 167 millones de triples, que se utilizan para entender el significado del término que el usuario introduce en la búsqueda; pero también para ofrecerle un sistema de exploración de la colección y, en general, de todos los recursos, basado en un buscador facetado, entre otras utilidades, que le permite disponer de todos los posibles modos de navegación sobre ese conjunto de entidades. La ontología y el RTVE Grafo permitirá representar los contenidos de un modo más preciso, detallado, exhaustivo y expresivo, y facilitará formas de relación entre los usuarios y los mismos de manera más natural y conversacional.
En definitiva, la explotación de un grafo de conocimiento de estas características hará posible en el futuro hibridarlo con otras tecnologías de inteligencia artificial con el fin de desarrollar servicios avanzados para diferentes grupos de usuarios Este modo nuevo de estar presente en la Web pretende, en suma, crear y utilizar de un modo intensivo y eficaz la base de conocimiento del patrimonio audiovisual español.
Los grafos de conocimiento representan la estructura de la realidad y el modo de operación de nuestra cognición
RTVE Grafo quiere resultar útil a las personas y a sus demandas de conocimiento expresadas a través de sus procesos de interrogación. Para ello, el proyecto ha transformado los datos y conocimientos masivos de RTVE Play en respuestas rápidas y precisas a preguntas complejas en un escenario que asume la necesidad de que las respuestas sean explicables, utilizando, para ello, inteligencia artificial basada en la emulación de un razonamiento similar al humano (razonamiento semántico) operada con la tecnología de grafos de conocimiento de alto rendimiento.
El grafo de conocimiento de RTVE Grafo está operado por IA para algunos propósitos específicos, como el de unificación de los tesauros del Archivo RTVE, proyecto clave para el enriquecimiento del metadatado de sus contenidos.
El sistema de interrogación
RTVE ha creado un sistema de búsqueda semántica que utiliza su grafo de conocimiento para ofrecer una experiencia de búsqueda contextual y enriquecida. Esto permite a los usuarios acceder a contenidos relevantes y organizados, facilitando la navegación y la recuperación de información en cualquier dispositivo.
RTVE-Grafo hace accesibles todos los contenidos de RTVE desde un solo punto de interrogación. El sistema búsqueda y recuperación contextual de la información de RTVE Play
El sistema de interrogación, búsqueda y recuperación contextual de la información de RTVE Play
Un grafo de conocimiento no solo es un medio para integrar información heterogénea y distribuida, mejorar la interoperabilidad de los sistemas o facilitar la representación del conocimiento a los documentalistas y otro personal experto, es también un medio para construir utilidades inteligentes para las personas. RTVE ha implementado para ello y sobre la base del grafo de conocimiento de RTVE Grafo un buscador semántico facetado que permite la búsqueda textual, la búsqueda contextual, la búsqueda avanzada por entidades, así como la generación de páginas con información enriquecida. En suma, ha construido un sistema de interrogación y recuperación de la información de RTVE PLay más intuitivo, sencillo, natural y contextual. Esto significa, en la práctica, que las búsquedas no solo se basan en palabras clave, sino en el significado y contexto de los términos, lo que las hace más eficientes y relevantes.
El proyecto RTVE Grafo persigue proporcionar la mejor experiencia posible a sus visitantes digitales, ofreciendo un motor de búsqueda que interroga un grafo de conocimiento donde están enlazados los recursos audiovisuales entre sí lo que posibilita presentar resultados bien organizados por entidades, además de enriquecidos y contextualizados. En definitiva, una de las finalidades del proyecto ha sido facilitar al público una experiencia de navegación y búsqueda más intuitiva, inteligente, personalizada, semánticamente significativa y eficaz.
Y todo ello, asegurando que esta nueva experiencia de descubrimiento de conocimiento y navegación por los contenidos de la Radio y Televisión Española funciona por igual sobre cualquier clase de dispositivo, de manera que todos los usuarios puedan acceder a lo que les interesa y actuar como deseen en el marco RTVE Grafo en cualquier momento y lugar.
RTVE Grafo está construida sobre tecnología de GNOSS, empresa que desde dos décadas trabaja en el desarrollo de capacidades propias para la construcción y explotación de grafos de conocimiento, una estructura matemática, computable por máquinas e interrogable por las personas, que representa bien, tanto la estructura de la realidad, como la de nuestra cognición y que, por consiguiente, están en el centro del Programa Simbólico de Inteligencia Artificial. GNOSS es también pionera en la construcción de la Web Semántica en España y en el ámbito más amplio del español. En 2010, GNOSS se convirtió en la primera empresa española en enlazar sus proyectos GNOSS y DIDACTALIA con Freebase, New York Times y DBPedia y, como consecuencia, en ser parte del proyecto global de construcción de la web semántica con datos abiertos y enlazables o Linked Open Data Cloud.
Con el fin de hacer realidad su propósito, GNOSS ha desarrollado GNOSS Semantic AI Platform, plataforma de desarrollo para la construcción de proyectos Inteligencia Artificial Simbólica o Semántica, que incluye un ecosistema de Servicios Cogntivos de Inteligencia Artificial. La familia de servicios de de Inteligencia Artificial de GNOSS Semantic AI Platform está formada por GNOSS Sherlock NLP-NLU, que engloba un conjunto de servicios de procesamiento de lenguaje natural orientados al reconocimiento y extracción de entidades y tópicos en los textos y a su posterior consolidación en un grafo de conocimiento y GNOSS LOKUT, un sistema de interrogación en lenguaje natural que hibrida grafos de conocimiento con LLMs con el fin de asegurar un resultado de la IA auditable, trazable y reproducible, que son los tres atributos de una IA Explicable.
Inteligencia Artificial Semántica
El sistema de conocimiento unificado de RTVE identifica las entidades del ámbito audiovisual, lo que permite a los usuarios interactuar con las máquinas de manera intuitiva. Esto facilita una exploración más profunda y contextualizada de los contenidos producidos por la televisión española, asegurando una comprensión semántica adecuada.
Inteligencia Artificial Semántica capaz de operar en un marco de ''sentido común'' con las personas
La característica tecnológica diferencial del proyecto RTVE Grafo es que toda la información generada por RTVE se integra y consolida en un grafo de conocimiento unificado, interrogable por máquinas y personas, que funciona como el artefacto cognitivo del proyecto de publicación y difusión en internet de la televisión española y que es interrogable desde un punto único.
El grafo de conocimiento unificado de la radio y televisión española reconoce las entidades del mundo audiovisual. Ello posibilita a las personas conversar con las máquinas en un marco de sentido común e indagar sobre cualquier contenido producido por la televisión española de un modo más profundo, contextual y semánticamente consciente.
El sistema de interrogación, búsqueda y recuperación de la información de RTVE Grafo trabaja en el escenario tecnológico del Programa de Inteligencia Artificial interpretada semánticamente o basada en la explotación por parte de humanos y máquinas de las posibilidades inherentes al enlazado de datos en un grafo de conocimiento.
Ello no sólo es la condición para que los sistemas puedan interpretar el conocimiento generado por RTVE, sino para enlazarlo entre sí y, en el futuro, con terceras fuentes que puedan enriquecer ese contenido y contextualizarlo, gracias al marco de Inteligencia Artificial Contextual que RTVE Grafo proporciona.
RTVE son conversaciones
RTVE se transforma en un espacio de diálogo, donde cada visitante es único y busca algo distinto. El Grafo de RTVE Play se erige como el puente que conecta a la plataforma con su diversa audiencia, creando conversaciones significativas y personalizadas.
RTVE son conversaciones
El nuevo Ecosistema Digital Semántico de RTVE Play posibilita una relación conversacional, significativa, contextual y más personal entre RTVE y sus usuarios.
RTVE son conversaciones. Conversaciones personales, pues cada usuario que la visita es distinto y desea cosas diferentes, construye preferencias varias, aspira a cosas diversas. RTVE debe ser capaz de hablar con todos. Hablar con sentido, oportunidad y utilidad con cada persona que se acerca sería el objetivo del grafo de RTVE Play, una plataforma con una fuerte vocación inclusiva que integra a todos, ciudadanos, usuarios habituales, profesores, investigadores, estudiantes, documentalistas, atendiendo a su inherente diversidad.
El proyecto digital RTVE Grafo permite generar ese relato, esa conversación personal con diversas audiencias proporcionando una conversación útil, contextual, rica, pero sobre todo personal.
El modelo ontológico de RTVE
Una ontología de dominio gestiona conceptos específicos de un área, ayudando a clarificar términos y representar conocimiento especializado. En el contexto del Grafo de Conocimiento de RTVE se utilizó la ontología EBUCorePlus, ampliada con otros vocabularios para mejorar la organización de la información audiovisual y la interoperabilidad entre sistemas.
Cómo se hizo el Grafo de Conocimiento de RTVE: El modelo ontológico
Estándares semánticos y datos enlazados
El Grafo de Conocimiento de RTVE Play se ha construido sobre los estándares de la web semántica y de acuerdo con los principios de la Web de Datos Enlazados (o Linked Data Web), lo que ha permitido:
- Conectar los sistemas de gestión de los recursos audiovisuales y documentación de Televisión Española con la publicación del espacio digital RTVE Grafo
- Optimizar el uso de dichos sistemas de documentación, dando valor al conjunto del trabajo de todas las áreas de la corporación
- Convertir el sistema de información de RTVE en un Grafo de Conocimiento que se expresa por medio de una Web de Datos Enlazados.
- Desarrollar modos de interrogación y visualización de ese Grafo adaptados a diferentes audiencias y orientados a maximizar la satisfacción de sus intereses, ofreciendo datos relacionados explícitamente con aquellos resultados que satisfacen las preguntas del usuario.
- Construir páginas web temáticas sobre la base de un conjunto de datos o subgrafo que cumpla con ciertos requisitos.
- Construir una experiencia semánticamente consciente de exploración, descubrimiento, interrogación y búsqueda por los contenidos de RTVE, que posibilita explorar en profundidad y de manera contextual cualquier tema relacionado con los recursos digitales que conforman en mundo de la televisión.
Todos los contenidos de esta web están representados y publicados según los estándares del W3C para la web semántica y de acuerdo con los principios que promueve el Linking Open Data Project con el fin de promover y facilitar la publicación y enlazado de datos en la web. Estos metadatos semánticos generan, como hemos ya señalado, un grafo de conocimiento unificado que es explotado en primera instancia, si bien no sólo, en la propia web a través de los sistemas de interrogación y recomendación, ofreciendo a los usuarios una experiencia superior.
El modelo ontológico de RTVE
Una ontología de dominio (u ontología de dominio específico) representa conceptos que pertenecen a una parte específica del mundo; puede considerarse por tanto que gestiona conocimiento altamente especializado. Las aspiraciones ontológicas de las ciencias y tecnologías de la información propenden a cerrar y controlar los vocabularios hasta donde sea posible con el fin de que el significado particular de un término perteneciente a ese dominio sea proporcionado por la ontología de manera precisa y sin ninguna clase de ambigüedades. La principal ontología o vocabulario específico que se ha utilizado en este proyecto ha sido el modelo de referencia EBUCorePlus, que provee de las descripciones y de la estructura formal para describir los conceptos explícitos e implícitos, y sus relaciones, utilizados en el dominio de la documentación del mundo audiovisual, lo que en la práctica permite representar, con los ajustes necesarios, de manera adecuada la información contenida en los sistemas de información de RTVE.
Las ontologías de dominio representan los conceptos de su ámbito de aplicación de manera muy específica, acotada y cerrada, como ya hemos señalado. Sin embargo, la realidad en su conjunto muestra una notable propensión a la continuidad y los dominios en los que se organiza el mundo suelen ser menos puros o más mezclados que nuestros vocabularios controlados. Es por ello por lo que los sistemas del mundo, tal y como puede ser considerada una televisión pública, necesitan de ontologías híbridas, que proceden de la mezcla e integración de diferentes ontologías de dominio en una representación más general.
El proyecto ontológico desarrollado en RTVE Play para la construcción de su Grafo de Conocimiento ha extendido la ontología de dominio EBUCorePlus y la ha hibridado con esquemas de metadatos y vocabularios de propósito general como son Dublin Core (dc) y schema, integrándolos en un marco ontológico común que representa el conjunto de las actividades desarrolladas en el ámbito audiovisual, entendido éste en el sentido de conjunto de técnicas, prácticas y procesos relativos al funcionamiento de un ente audiovisual.
En el siguiente punto explicitamos el proceso de extensión ontológica e hibridación realizado en el proyecto de la plataforma semántica digital RTVE Grafo. El modelo ontológico se utiliza no sólo para generar un dataset reutilizable, sino también para resolver el conjunto de operaciones e interrogaciones que puedan querer realizar los distintos grupos de usuarios sobre ese conocimiento así representado.
La red de ontologías de RTVE
Con este proyecto, RTVE aborda la confección de una ontología que pueda operar mediante un grafo de conocimiento, teniendo como propósito principal mejorar la interoperabilidad semántica de la nueva plataforma RTVE Grafo con diversos sistemas, participantes del mercado y con el Archivo de RTVE, así como la implementación de un estándar europeo de referencia dentro del sector audiovisual español, además de poner a disposición del público general todo el patrimonio audiovisual del área de interactivos a través de un punto único de interrogación.
Ontología RTVE Play. Principios de modelado
RTVE, en calidad de miembro de la Unión Europea de Radiodifusión (UER), forma parte de iniciativas de estandarización como el grupo EBU-AIM, el cual supervisa y promueve la implementación de sistemas estándares de metadatos como es EBUCorePlus.
La integración de estándares en el ámbito de representación del conocimiento dentro de una organización propicia una mejora en la interoperabilidad tanto interna como externa, simplifica la vinculación de datos y fortalece la conexión con otras ontologías que representan el contenido. Es por esto por lo que, en el ámbito de este proyecto, se ha partido de los siguientes principios de diseño para la elaboración de la ontología de RTVE:
- Utilización como ontología de referencia EBUCorePlus.
- Adhesión a la ontología de referencia siempre que sea posible. En el modelado del dominio se adoptarán preferentemente las clases, atributos y relaciones de EBUCOREPLUS siempre que sea semánticamente compatible con los objetos del domino a modelar
- Mecanismos de extensión: cuando el modelo de referencia no cubra las necesidades requeridas para el modelado del dominio (i.e. en aquellos casos en los que surjan propiedades específicas que refinan una clase, cuando cambia la cardinalidad de alguna propiedad o cuando sea relevante semánticamente) se procederá a la extensión del modelo recurriendo a mecanismos de herencia. Las nuevas clases y atributos se alojan en un espacio de nombre propio denominado RTVE Play.
El dominio modelado se corresponde con la totalidad de los contenidos que RTVE tiene disponibles online (más de dos millones de recursos multimedia). Estos contenidos se exponen a través de la web RTVE Play. En aquellos casos en los que se puede hacer uso directo de la clase de la ontología de referencia se ha optado por ello, sin embargo, en otros de estos casos se ha optado por un mecanismo de extensión de la clase de referencia con el objeto de dar cabida a las propiedades específicas del modelo de negocio de RTVE.
Exposición detallada del modelo ontológico de RTVE Play
La ontología RTVE Play a la que nos referimos se ha consolidado en lo que denominamos el Modelo Ontológico de RTVE Play, que está compuesto de un conjunto de vocabularios articulados alrededor del modelo EBUCorePlus.
EBUCorePlus es una extensión de la especificación EBUCore, que es un estándar desarrollado por la Unión Europea de Radiodifusión (European Broadcasting Union, EBU) para la descripción y el intercambio de metadatos de contenido audiovisual. EBUCore proporciona un modelo de metadatos que cubre varios aspectos del contenido, como la identificación, descripción, derechos, y técnicas.
EBUCorePlus se basa en EBUCore y agrega capacidades adicionales para soportar necesidades específicas de la industria audiovisual. Estas extensiones incluyen:
- Mejoras en la descripción del contenido: Añadiendo más detalles y categorías para una descripción más precisa del contenido audiovisual.
- Soporte para nuevos tipos de contenido: Adaptación a las nuevas formas de medios y formatos que puedan surgir.
- Interoperabilidad mejorada: Facilitando el intercambio de metadatos entre diferentes sistemas y plataformas de una manera más eficiente.
- Integración con otros estándares: Mejor compatibilidad e integración con otros modelos de metadatos y estándares tecnológicos.
- Avances en la gestión de derechos y protección de contenido: Proporcionando estructuras para manejar mejor los derechos de autor y la distribución del contenido.
EBUCorePlus es utilizado principalmente por radiodifusores, productores de contenido, archivos audiovisuales, y otros actores en la cadena de valor de los medios para asegurar que los metadatos asociados al contenido audiovisual sean precisos, completos y útiles para una variedad de aplicaciones, desde la producción y distribución hasta el archivo y la recuperación.
Como decimos, para el caso del grafo de RTVE Play se partió de EBUCorePlus extendiendo la ontología, dotándola de nuevas clases, atributos y relaciones en aquellos casos donde las necesidades específicas del proyecto lo requerían, bien por dar precisión semántica a las clases según los contenidos manejados por RTVE o bien para refinar la cardinalidad de algunos de sus atributos.
La siguiente imagen representa modelo de clases definido en la ontología RTVE Play.
Una simplificación del modelo de clases general que nos permite identificar las principales clases del mismo es el que representa el siguiente diagrama:
Las principales entidades de la web semántica RTVE Play: Programa, Temporada, Vídeo, Audio, Género, Agente, se representan según el mencionado modelo de referencia de EBUCorePlus o bien se recurre a mecanismos de extensión para aquellos casos en los que el modelo de referencia no cubra las necesidades requeridas para el modelado del dominio (i.e. en aquellos casos en los que surjan propiedades específicas que refinan una clase, cuando cambia la cardinalidad de alguna propiedad o cuando sea relevante semánticamente).
Entre los principales elementos del dominio encontramos, en primer lugar, el programa, entendido como un contenedor de información que relaciona diferentes elementos que de manera coherente conforman una unidad lógica de emisión. Los programas, que pueden ser de televisión o radio, son los que agrupan contenidos de vídeo y audio. Para modelar Programa partimos de la clase de la ontología de referencia EditorialGroup, que se define en EBUCorePlus como “una colección/grupo de recursos media”. EditorialGroup da cobertura al concepto de programa, y posee unas subclases (Series, Serial, Colección, etc.) que nos permitirán clasificar los programas convenientemente.
Como hemos comentado en el párrafo anterior, los programas pueden ser de TV o Radio (y tener asociados recursos de vídeo y audio). Para modelar tanto el vídeo como el audio, partimos de la clase Programme, utilizando TVProgramme para los vídeos (un TVProgramme es “un programa para su distribución en canales de TV”) y RadioProgramme para los audios (un RadioProgramme es “un programa para su distribución en canales de radio”).
Los programas, audios y vídeos se relacionan con personas y organizaciones, en la medida en la que estas participan en la producción del material audiovisual (actores, directores, productores, etc.) Para modelar esto, se ha recurrido a extender la clase Agent de EBUCorePlus al espacio de nombres de RTVE Play y denominarla Agente, dado que se prevé que puede haber personas y organizaciones provenientes de fuentes distintas, que necesitarán atributos de información propios de RTVE. Agent es definida en EBUCorePlus como “un contacto, persona u organización al que se asocia un rol correspondiente a la contribución que el «Agente» aporta a la realización de un MediaResource o EditorialObject”. Recordemos que EditorialObject es la clase padre de la que hereda EditorialGroup, que es la que hemos utilizado como base para modelar Programa mediante un mecanismo de extensión.
En cuanto a los géneros, se ha recurrido a implementar tres de las siete dimensiones que se utilizan en ESCORT2007, el sistema de clasificación de EBU para programas de radio y televisión, para los programas, audios y vídeos. En concreto, se han utilizado las dimensiones Intención, Formato y Contenido.
Con el fin de asegurar un mayor control del vocabulario empleado para la descripción de los objetos, se ha implementado una ontología OWL propia para el proyecto semántico del RTVE Play y para cada uno de los objetos mencionados.
- RTVE-Grafo de un proyecto de Interoperabilidad Semántica 1
- Estándares de representación del conocimiento 2
- Anotación semántica y poblado del grafo de RTVE 3
- El sistema de interrogación, búsqueda y recuperación contextual de la información de RTVE Play 4
- Inteligencia Artificial Semántica capaz de operar en un marco de ''sentido común'' con las personas 5
- RTVE son conversaciones 6
- El modelo ontológico de RTVE 7