Innovación
Programas de Innovación
Programa Tizona
Motivación
El programa de innovación Tizona hace frente a los desafíos más importantes que se plantean en el campo de las bases de datos, esto es: rendimiento, heterogeneidad de los datos y cantidad masiva de información.
Los problemas y ámbitos que se investigan en Tizona constituyen la base de los sistemas de inteligencia: las tecnologías que tienen como misión obtener y procesar los datos en los que se basan el análisis y la toma de decisiones. Por tanto, se investigan, diseñan, y desarrollan soluciones orientadas a mejorar la captura, tratamiento, almacenamiento, y proceso de los datos de los que se nutre un sistema de inteligencia.
Las tecnologías existentes adolecen de ciertas carencias, ya que se basan en bases de datos relacionales, de grafos o multidimensionales. Los tres enfoques presentan limitaciones. Tizona se enfrenta a estas limitaciones con una propuesta innovadora basada en las bases de datos semánticas. En última instancia, Tizona persigue almacenar conceptos formalmente expresados e integrados en una serie de ontologías. Trabajar con conceptos permitirá al sistema entender nociones abstractas, por ejemplo, qué es una provincia, o qué es una comunidad autónoma. Por otro lado, pasar de un ámbito del conocimiento a otro sólo implicaría incorporar nuevas ontologías a la base de datos sin necesidad de cambiar el software que la gestiona.
Objetivos
A nivel técnico, se trata de diseñar y desarrollar una base de datos semántica RDF de alto rendimiento con las siguientes exigencias: alta escalabilidad, nivel de integración e interoperabilidad. Concretamente:
- Módulo de persistencia que almacene los datos en formato RDF y se basa en B-Trees y Hash.
- Módulo de indexación que permita la búsqueda de texto libre y la utilización de algoritmos de minería de datos.
- Módulo de acceso para conectar la base de datos a entornos semánticos mediante un driver JDBC.
- Motor semántico capaz de acceder a los datos RDF almacenados. Incluye un motor de inferencia que permite realizar deducciones sobre la base de hechos generando conocimiento nuevo en base a las reglas definidas en las ontologías de contexto del sistema.
- Ontologías de contexto válidas para los sistemas de inteligencia y basadas en estándares ya existentes.
- Interfaz web de acceso para la gestión y administración de todos los servicios y componentes, así como la edición y la consulta de los contenidos de la base de datos.
Proyectos en curso derivados del Programa
ISIS Tizona integra bajo un mismo entorno tres tecnologías clave en los sistemas de inteligencia:
- Base de datos semántica distribuida. Almacena datos en función de su significado, esto es, como representaciones formales de conocimiento.
- Ontologías de inteligencia. Definen los datos y las reglas lógicas que conforman el conocimiento de Interligare y otros expertos en materia de inteligencia.
- Herramientas de extracción de información. Pila de aplicaciones diseñadas para una eficiente extracción de contenidos de documentos no estructurados alojados en múltiples fuentes.
Disponer de una base de datos semántica de alto rendimiento, un conjunto de ontologías de dominios y un motor de inferencias, abre la puerta al diseño y desarrollo de una nueva familia de aplicaciones y herramientas para los sistemas de inteligencia. El conjunto de aplicaciones que podremos ofrecer permitirán integrar lo último, en sistemas de aprendizaje basados en casos o las últimas técnicas de análisis. Todo ello integrado bajo un mismo motor de razonamiento.
Financiación Pública
Derivado del programa Tizona se ha presentado a la Convocatoria: Proyectos de Investigación y Desarrollo (PID) - CDTI, el proyecto del mismo nombre, TIZONA, habiendo resultado concedido.