Cenit Buscamedia

BUSCAMEDIA es un proyecto CENIT que pretende lograr un significativo avance en las áreas de semántica, producción audiovisual y distribución de media enriquecido con independencia de redes y terminales de consumo, con el objetivo de crear un buscador semántico multimedia único en el mundo.

Buscamedia creará un buscador semántico multimedia único en el mundo, uniendo una gran variedad de aspectos innovadores en el estado de la técnica

Buscamedia es un proyecto que pretende el desarrollo de tecnologías de búsqueda multimedia y gestión automatizada de activos que permita crear una base sólida para el desarrollo de una amplia gama de servicios de muy diversa índole en el ecosistema audiovisual. Con ello se pretende situar a la industria española a la cabeza del estado del arte en sistemas de búsqueda y producción multimedia, así como automatización de procesos audiovisuales, apoyando la innovación en estas tecnologías con el desarrollo de ontologías basadas en semántica española, que sirvan de base para una clasificación audiovisual propia, que permita explotar el potencial de los mercados con presencia lingüística hispana. Dentro de estos desarrollos lingüísticos se incorporarán todas las lenguas co-oficiales del Estado, de manera que manifieste la característica inter-territorial y se garanticen los derechos constitucionales. BUSCAMEDIA recoge en su iniciativa numerosos avances técnicos y científicos muy por delante del estado del arte que serán soporte en el futuro cercano para la generación de nuevos conocimientos de utilidad para la creación de nuevos productos, procesos o servicios, y para la integración de tecnologías de interés estratégico.

Resumen Paquetes

El proyecto BUSCAMEDIA está dividido en 8 actividades principales: PT1 - Gestión y Administración El objetivo de este paquete de trabajo es el de planificar y llevar a cabo las acciones necesarias para la coordinación de los trabajos de todas las entidades participantes en el proyecto, así como las labores de enlace e información a los representantes del CDTI. Asimismo se necesitará establecer y gestionar las relaciones necesarias con terceros y desarrollar las tareas de gestión económico-administrativa del proyecto.

La buena gestión de un proyecto es una de las principales claves para el éxito del mismo. Buscamedia cumple con las mejores garantías para que desde el PT1 esto sea así

Se realizarán las tareas necesarias para asegurar el rendimiento del proyecto y sus actividades de acuerdo con las obligaciones contractuales colissimo 2019. Se asegurará la adecuada colaboración entre los grupos de trabajo, el desarrollo de los diferentes entregables del proyecto y la calidad del trabajo técnico. También se gestionarán y llevarán a cabo todos los temas financieros del proyecto, así como todos los aspectos técnicos del mismo. Mediante la metodología PMI® Buscamedia asegurará la máxima eficiencia en la coordinación de las tareas dentro de Buscamedia

colissimo

PT2 - Modelado y Arquitectura
El objetivo de este paquete de trabajo es la realización de las bases técnicas (modelado del sistema tanto físico como lógico, arquitectura basada en "cloud computing", definir los escenarios futuros de explotación y las necesidades de privacidad, seguridad e interoperabilidad) que permitan a los siguientes paquetes de trabajo poder alcanzar sus objetivos de investigación y sentar las bases de los nuevos paradigmas tecnológicos necesarios para el éxito del proyecto.

El PT2 será el nexo de unión entre el resto de actividades dentro de Buscamedia, uniendo requisitos y desarrollos, y asegurando la homogenización técnica necesaria para el éxito del proyecto

Más concretamente el paquete de trabajo realizará el modelado y definirá la arquitectura del sistema completo mediante:

Una definición a alto nivel de la clasificación y la semántica, con el objetivo de delimitar los módulos presentes en la arquitectura. Esta definición permitirá posteriormente en el PT3 realizar una clasificación semántica multimedia (especialmente adaptada a la lengua española y lenguas co-oficiales, y con traducción directa al inglés). Además, gracias a esta clasificación se podrá definir tanto un marco común como unas directrices de búsqueda de información multimedia partiendo de cualquiera de los tipos de información multimedia (texto, audio, video) o una combinación de ellos para obtener la información multimedia que el usuario desee. La definición de la gestión adaptada de contenidos para permitir su búsqueda y adaptación y personalización al usuario y terminal, y útil para la evolución hacia los nuevos paradigmas semánticos multimedia. La propia definición y el diseño de la arquitectura distribuida del sistema basada en el paradigma "clould computing" para permitir realizar la búsqueda de manera rápida y eficiente, y de las interfaces y el modelo de datos de BUSCAMEDIA. Además se adaptará esta arquitectura a las redes avanzadas de distribución identificadas (p.ej. overlay P2P) y al paradigma "User Centric Media". Definir los escenarios futuros de explotación de los resultados del proyecto, que sirvan como base para la realización de activos de experimentación. Definir la privacidad, seguridad e interoperabilidad del sistema para que cada uno de los paquetes de trabajo sepa cómo implementar estas características de sistema. PT3 - Ontología M3 El objetivo fundamental de esta tarea es la investigación de los modelos formales de representación de información multimedia, de cara a ser utilizada por parte del buscador multimedia semántico BUSCAMEDIA.

El PT3 tiene como objetivo del desarrollo de una Ontología M3, multilingüe, multidominio y multimedia, que asegure el avance tecnológico requerido de un proyecto ambicioso como Buscamedia

La utilización de dicho enfoque semántico permitirá:

El modelado y descripción de toda información multimedia, independientemente del formato en el que se encuentra disponible (vídeo, imagen, audio, texto o combinaciones). Dicho modelo permitirá la producción y explotación del contenido digital de manera independiente a la plataforma, de manera que los objetos multimedia sean reusables en cualquier circunstancia. Este enfoque facilitará la inter-relación entre objetos multimedia gracias a la meta-información y anotación utilizada para describir el contenido. La utilización de distintos niveles de representación de la información multimedia que permita aliviar el salto semántico, desde información no visual que está relacionada con la imagen pero que no es explícita en su apariencia (por ejemplo, el precio asociado a una pintura), hasta la información sintáctica y semántica audiovisual (por ejemplo, el color, textura, formas, estructuras u otra información sintáctica que se puede extraer de la imagen, así como objetos, escenas, y relaciones concretas identificadas que aporten información semántica).
Identificar el rol de la información de dominio en la resolución del salto semántico. Por ejemplo, en un dominio concreto la variabilidad de las características es limitado y predecible (por ejemplo, en el dominio concreto de retratos, aunque cada cara es única y existe un grado de posibles detalles diferentes, existen claras restricciones que gobiernan el dominio). Por otro lado, un dominio abierto eleva las posibilidades del contenido multimedia de manera ilimitada (por ejemplo, en un archivo fotográfico de carácter general). Acceder a dicha información utilizando cualquiera de las lenguas oficiales del Estado. PT4 - Anotación e Indexación Semántica de Archivos Multimedia Este paquete de trabajo está centrado en la investigación de diversos aspectos de la anotación e indexación semántica y automática de los contenidos multimedia. Este objetivo se abordará desde 3 perspectivas:

Desde la indexación semántica que permita entender y modificar automáticamente las partes lingüísticas de cualquier tipo de documento archivado en la base de datos de BUSCAMEDIA. Desde la perspectiva clásica del reconocimiento automático de patrones en contenidos audiovisuales (sea gracias a la visión avanzada por ordenador y al procesamiento de imágenes, sea gracias a las tecnologías para la anotación automática de sonidos que permitan crear y explotar bases de datos de sonidos). Como también desde una perspectiva más novedosa basada en la fusión multimodal de las anteriores 3 disciplinas. En el PT4 se abordará la investigación relacionada con la anotación e indexación semántica y automática, dando un salto de calidad al actual estado del arte

El análisis de las escenas de video es esencial y básico si queremos desarrollar un sistema que realice búsquedas semánticas precisas de contenido audiovisual de una forma avanzada y que además supere la brecha semántica entre hombre y computadora. No se trata tan sólo de enriquecer los metadatos que caracterizan y describen estos contenidos media para facilitar posteriores búsquedas, sino también de establecer los mecanismos para poder recuperar contenidos media mediante búsquedas que no son textuales. Así, la extracción automática de metadatos y la anotación de contenido permitirán crear los metadatos más elaborados de forma automática o semi-automática, así como calificar los contenidos en base a la ontología BUSCAMEDIA, cara todo ello a permitir búsquedas textuales avanzadas con el motor semántico M3. Por otro lado, la recuperación de imágenes basada en contenidos (e.j., un fragmento de audio o una imagen como ejemplo) será la clave para poder, por un lado prescindir de la necesidad de realizar la búsqueda con texto, y por el otro, permitir al usuario realizar búsquedas más intuitivas, eficientes, y humanas.

PT5 - Búsqueda semántica con interacción en lenguaje natural br Realizar un profundo análisis del tratamiento de expresiones de búsqueda en el lenguaje natural, de forma que se posibilite la interacción con el sistema de manera no forzada. Se trata de la intermediación entre el usuario del sistema y el buscador multimedia, facilitando la interacción al usuario. La posibilidad de emplear lenguaje natural permitiría interactuar con el sistema de búsqueda sin necesidad de aprender ninguna sintaxis de consulta, ya fuese ésta escrita o gráfica.

El PT3 facilitará el desarrollo de la interacción hombre-máquina, haciéndola más natural y abordando conceptos futuristas para conseguirlo

En este paquete de trabajo se tomará como punto de partida una expresión en lenguaje natural que podría provenir de distintas fuentes: es un texto escrito por el usuario a través de una interfaz o es la transcripción escrita de un fichero de audio o una pista de vídeo que el usuario desea emplear para interactuar con el sistema o es un texto proveniente de alguno de los metadatos asociados a un elemento multimedia. La obtención de las transcripciones se realizará mediante técnicas de conversión de voz a texto. Atendiendo al origen de las expresiones en lenguaje natural y a su forma, se realizarán tratamientos de información mediante ontologías (construidas en el PT3), sistemas de búsqueda de respuesta, técnicas de recuperación de información y posibilidades de combinaciones entre dichos sistemas y técnicas.

PT6 - Tecnologías para la generación Automática de Contenidos El objetivo es la investigación y el desarrollo de tecnologías que permitan generar automáticamente contenidos M3 (multilingüe, multidominio y multimedia) adaptados a las necesidades de nuevas experiencias de consumo audiovisual de los usuarios.

Para ello, se centrará la investigación en los siguientes ejes:

Generación de discurso y narrativa multimedia y multilingüe
Generación de audio sintético adaptable y emocional
Generación de vídeo
Adaptación de contenidos multimedia al dispositivo y entorno de consumo (adaptación narrativa, audiovisual y tecnológica)
En el marco del PT6 se pretende desarrollar una generación automática de contenidos, viendo alcanzable el objetivo de la generación automática de la narrativa audiovisual

El estudio y el desarrollo realizado en estas tecnologías permitirían a la plataforma BUSCAMEDIA dar respuestas multimedia adaptadas a los contextos de usuario. El retorno de una consulta, por ejemplo, podría ser un resumen audiovisual que explique los principales resultados de una búsqueda. Todas estas tecnologías podrán ser utilizadas por usuarios finales (por ejemplo, en TV interactiva la integración de estas tecnologías permitirá la creación en tiempo real de contenidos inteligentes que respondan a las búsquedas del usuario) o por usuarios profesionales durante la etapa de producción de contenido (estos tendrán capacidad de creación/administración de nuevos patrones de generación automática y de nuevas plantillas narrativas para la presentación de los resultados).

PT7 - Personalización y adaptación al contexto del usuario
El objetivo de este paquete de trabajo es la realización de un modelado de los perfiles de usuario necesarios que permitan la personalización de las búsquedas en base a las preferencias/consumos de los usuarios del sistema, ya sean profesionales o no, y determinando el contenido relevante al usuario y su contexto personal. La personalización señalada permite que los usuarios obtengan mejores resultados y que a su vez el sistema BUSCAMEDIA se vea realimentado por datos útiles que le permitan mejorar las técnicas utilizadas y las ontologías entre tipos de información. Uno de los objetivos de esta tarea, y del proyecto BUSCAMEDIA en general, será mejorar la experiencia de búsqueda del usuario al realizar búsquedas multimedia. Dado que se pretende facilitar el acceso a diferentes tipos de recursos (audio, video o texto), la implementación de paradigmas de interacción y visualización eficientes que exploten la información semántica, textual y audiovisual indexada resultará un aspecto muy relevante e innovador para el proyecto.

Buscando un futuro exigente, en el PT7 se investigará en los sistemas necesarios dentro de Buscamedia para la personalización y contextualización de las respuestas al propio usuario

Así mismo, la explotación del conocimiento aportado por la interacción de los usuarios en el sistema en entornos Web 2.0 en forma de comentarios, opiniones, etiquetas o bookmarks, así como el contexto social del usuario (por ejemplo, amigos o contactos) facilita la recomendación de contenidos relacionados con una búsqueda concreta basados, no solamente en una proximidad semántica y/o probabilística entre los contenidos, sino en los gustos o experiencias que otros usuarios han tenido previamente, así como la implementación de paradigmas de navegación frente a los paradigmas consulta-lista de resultados más clásicos en este tipo de sistemas.

PT8 - Nuevas tecnologías de Acceso

Se estudiará el proceso de integración de los flujos de media que aseguren el acceso universal a los contenidos audiovisuales, independientemente de las capacidades, características y preferencias de los usuarios, así como de las características de los datos a presentar, haciendo especial énfasis en la convergencia de todos los actores involucrados.

Buscar la convergencia de tecnologías para la provisión y el acceso a los servicios Buscamedia será el gran reto a abordar dentro del PT8

Además, se realizará una prueba de concepto sobre una red P2P con el objetivo de validar los resultados obtenidos en los paquetes de trabajo anteriores, profundizando para ello tanto en la necesidad de la gestión adaptada de contenidos analizada en el PT2 como en el uso de las tecnologías definidas en la tarea 8.1 que vendrán a permitir el acceso universal. Finalmente, se avanzará en los métodos de presentación adaptada de contenidos según las características de los terminales de usuario y los interfaces disponibles para ello, así como en el estudio de la gestión de los contenidos multimedia generados por los propios usuarios.

Gestión y Administración

El objetivo de este paquete de trabajo es el de planificar y llevar a cabo las acciones necesarias para la coordinación de los trabajos de todas las entidades participantes en el proyecto, así como las labores de enlace e información a los representantes del CDTI. Asimismo se necesitará establecer y gestionar las relaciones necesarias con terceros y desarrollar las tareas de gestión económico-administrativa del proyecto.

La buena gestión de un proyecto es una de las principales claves para el éxito del mismo. Buscamedia cumple con las mejores garantías para que desde el PT1 esto sea así

Se realizarán las tareas necesarias para asegurar el rendimiento del proyecto y sus actividades de acuerdo con las obligaciones contractuales. Se asegurará la adecuada colaboración entre los grupos de trabajo, el desarrollo de los diferentes entregables del proyecto y la calidad del trabajo técnico. También se gestionarán y llevarán a cabo todos los temas financieros del proyecto, así como todos los aspectos técnicos del mismo. Mediante la metodología PMI® Buscamedia asegurará la máxima eficiencia en la coordinación de las tareas dentro de Buscamedia

Socios Buscamedia

Atos Origin es una compañía internacional de Servicios de Tecnologías de la Información (TI), creada en octubre de 2000 tras la fusión de la compañía francesa Atos y Origin, una subsidiaria de Phillips. Con sede en Bruselas está implantada actualmente en 40 países, con experiencia en sectores financieros, administración pública, energía, telecomunicaciones, transporte, salud, industria, fabricación y logística, asistencia a PYMES, desarrollo de recursos humanos y protección del medio ambiente.

Atos Origin, como líder del proyecto Buscamedia trabajará aportando su experiencia como uno de las empresas líderes del sector de las Tecnologías de la Información

Atos Origin SAE, con sede central en Madrid, integra la presencia geográfica, actividades, desarrollo y posicionamiento estratégico de sus sociedades presentes en la Península con un equipo de cerca de 5.500 profesionales. Su amplia experiencia y capacidad de servicio, su alto nivel de competencia tecnológica, un profundo conocimiento de los sectores del mercado en los que actúa y una sólida plataforma de productos propios y de terceros son la base sobre la que construye sus soluciones.

ACTIVA MULTIMEDIA DIGITAL, S.L. es una empresa constituida en el año 2001 cuyo objetivo es la creación de contenidos y servicios para el mundo digital. ACTIVA MULTIMEDIA pertenece a la Corporació Catalana de Mitjans Audiovisuals (CCMA).

Activa Multimedia aportará su experiencia en el liderazgo de la investigación de tecnologías para la generación automática de contenidos

Activa Multimedia ha desarrollado sus actividades comerciales en el marco de la CCMA a la que pertenece y transfiriendo al mercado, con nuevos e innovadores productos y servicios, el conocimiento adquirido en las distintas actividades de I+D+i que ha estado desarrollando durante los últimos 10 años. Su procedencia del mundo de la comunicación audiovisual, y su dominio y proximidad de los medios multimedia y televisivos le han proporcionado un gran conocimiento de las preferencias y necesidades de los profesionales del sector, convirtiéndoles en líderes dentro del mercado nacional de de producción y gestión automática de video.

GFI Informática es una empresa de Consultoría y Servicios Informáticos con más de 1.500 profesionales en España y 10.000 en todo el mundo. La matriz de GFI es francesa y cotiza en el mercado público de París. En España, GFI Informática proporciona soluciones globales a sus clientes en todo lo relativo a Sistemas de Información, Consultoría, Diseño y Concepción, Desarrollo e Implementación, así como en Mantenimiento Evolutivo y Correctivo, y en el Soporte a Sistemas y Aplicaciones en Producción. Estamos centrados en tecnologías abiertas y de nueva generación y nuestros clientes pertenecen a todos los sectores del mercado, especialmente Administración Pública, Telecomunicaciones, Banca, Seguros y resto de Industria en general.

GFI aportará su experiencia en el desarrollo de Sistemas de Información para liderar las nuevas tecnologías de acceso necesarias en la distribución del sistema Buscamedia

Nuestros consultores y equipos de desarrollo de proyectos poseen una amplia experiencia en gestión y mejora de procesos de negocio, gestión documental y de contenidos, sistemas distribuidos, arquitecturas SOA, inteligencia de negocio y calidad del software, normalmente enfocados hacia aplicaciones mission critical. Utilizamos tecnologías innovadoras y nos apoyamos en los productos de nuestros importantes partners tecnológicos (como Oracle o HP) o productos propios proporcionando a nuestros clientes soluciones cerradas y completas que les permiten mejorar su capacidad competitiva y su eficiencia operativa.

Bilbomática, es una empresa de Consultoría y Servicios Informáticos, presente en el mundo de la tecnología de la información desde 1988. Nuestra base de conocimientos se encuentra cimentada en una trayectoria en el área de los desarrollos a medida, donde se ha apostado por una formación continua del personal en las nuevas tecnologías, apoyada en el desarrollo de proyectos innovadores, que nos obligan a estar en un proceso continuo de mejora.

Bilbomatica tendrá en Buscamedia un rol fundamental en el liderazgo de la anotación e indexación semántica de contenidos multimedia

Con el objetivo de obtener mejores resultados y desarrollar soluciones de primera clase, Bilbomática, forma alianzas con las compañías líderes en software y hardware. Estas relaciones son una inversión en el desarrollo conjunto de soluciones para dar respuesta a las necesidades específicas de nuestros clientes. Los recursos de nuestros socios, combinados con nuestra experiencia, hacen de nuestros programas de alianza un valioso recurso para nuestros clientes. Algunos de nuestros socios de alianza son: Oracle, Sap, Microsoft, IBM internacional, Esri,.... Así como en el ámbito del software libre Alfresco, Magnolia,... Actualmente Bilbomática cuenta con una plantilla de más de 300 profesionales en sus cuatro delegaciones de Bilbao, Madrid, Barcelona y Pamplona (delegación comercial en Valencia), con la misión de construir relaciones y desarrollar soluciones innovadoras que ayuden a personas y organizaciones dinámicas a crear valor.

TVC es una entidad de producción y emisión de televisión dependiente del Gobierno Autonómico de Cataluña a través del grupo Corporació Catalana de Mitjans Audiovisuals (CCMA). Emite en la actualidad 6 canales de televisión en lengua catalana, 5 de los cuales se difunden por TDT (TV3, Canal 33, 324, Super3/300 y TV3 HD) con cobertura principal en Cataluña y uno por satélite (TV3CAT) difundido por Astra. Más del 60% de los programas emitidos son producidos en la propia empresa.

La participación de Televisió de Catalunya en el proyecto Buscamedia, permitirá el uso de contenidos de un radiodifusor y la puesta en escena de las tecnologías del proyecto

El esfuerzo en digitalización ha permitido a Televisió de Catalunya disponer actualmente de más de 120.000 horas de archivo digital accesible en línea, y de potentes herramientas para el proceso de producción y distribución de contenidos audiovisuales. Esta experiencia también ha hecho que Televisió de Catalunya sea descubridora de los nuevos retos que conlleva la tecnología digital y la ha llevado a participar a distintos proyectos de ámbito español y europeo.