INTELLIGENT DATA ANALYSIS (TIC 239)

Director/a

Norberto Díaz Díaz. Escuela Politécnica Superior; Departamento de Deporte e Informática; Área de Lenguajes y Sistemas Informáticos.

Presentación

El grupo Intelligent Data Analysis (DATAi) está formado por investigadores del Área de
Lenguajes y Sistemas Informáticos de la Universidad Pablo de Olavide, especializados en el procesamiento y análisis de grandes bases de datos mediante técnicas de Inteligencia Artificial y de Soft Computing.

Los científicos poseen una amplia experiencia en el desarrollo de las técnicas de inteligencia artificial y descubrimientos de patrones para obtener aplicaciones de calidad como queda patente en los diferentes proyectos nacionales e internacionales en los que han trabajado como son: "Sistemas inteligentes para descubrir patrones de comportamiento. Aplicación a bases de datos biológicas"; "Identificación de patrones complejos y validación automática en bases de datos genómicas": "MINDAT-PLUS: Minería de datos para los usuarios en diferentes áreas de aplicación": o "Análisis inteligente de información biomédica", entre otros.

También cuentan con experiencia en el desarrollo del proyectos relacionados con el desarrollo de sistema de información que ayudan a tomar decisiones como "Natureinspired smart information systems"; "Metaheurísticas para la aplicación de metodologías fuzz y en el desarrollo de sistemas de ayuda a la decisión"; y "European Network on Intelligent Technologies for Smart Adaptive Systems (EUNITE)", así como en el desarrollo de proyectos con empresas como el denominado "Sistema inteligente de corte y empaquetado: diseño, implementación, evaluación práctica e implantación en empresas del sector".

Por otro lado, cabe destacar la participación de los científicos en el proyecto nacional "DIFFERENTIAL" (http://150.214.203.12/differential/), que tiene como objetivo reducir el porcentaje del consumo de energía aplicando el análisis de Big Data a los datos generados por sensores ubicados en edificios públicos. En particular, el subproyecto "DIFFERENTIAL@UPO: Massive Data Management, Filtering and Exploratory Analysis" (TIN2015-64776-C3-2-R) el cual se enfoca en proporcionar técnicas y herramientas para el filtrado automático y análisis exploratorio de datos generados por sensores de consumo de electricidad, como un primer paso necesario para un mayor análisis de datos de sensores y explotación. Dada la frecuencia de medición y el alto número de sensores considerados, los conjuntos de datos recopilados presentan volúmenes masivos y deben considerarse dentro del paradigma del Big Data. Además, dichos datos se ven particularmente afectados por lecturas (parcialmente) incorrectas y no fiables debido a operaciones defectuosas del sensor.

Así mismo, en el ámbito del aprendizaje automático (Machine Learning), destaca el proyecto apodado "OCEAN", sobre aprendizaje automático en optimización de procesos para generación y purificación de biocombustibles; la motivación de dicho proyecto es la búsqueda de nuevas tecnologías limpias, motivada por la necesidad de reducir emisiones gaseosas y por el deseo de hacer que los procesos industriales sean medioambientalmente sostenibles. Este proyecto plantea crear una tecnología ambiciosa para generar diseños conceptuales para procesos de separación y almacenamiento de gases en los que se utilizan estructuras porosas cristalinas.

OCEAN utiliza técnicas de aprendizaje automático para encontrar y/o establecer relaciones entre estructuras, absorción del gas y diseño de proceso, con el fin de optimizar los procesos e identificar los materiales adecuados en cada caso. OCEAN integra conceptos de química, ingeniería química y ciencias de la información. Y establece un lenguaje común entre estas disciplinas, que permite a investigadores de diversos campos trabajar y comunicarse entre ellos.

Finalmente, los expertos han abordado trabajos relacionados con el estudio del subconjunto de variables que mejoran el rendimiento de modelos predictivos. La mayor parte de estos trabajos tienen sus aplicaciones en el ámbito de la Biología, pero también trabajan con simulaciones que son aplicadas a modelos predictivos.

Líneas de investigación

- Tecnologías de la Información y la Comunicación.
- Análisis Inteligente de Datos.
- Big Data ; Bioinformática.
- Ciencia computacional (Machine Learning, Deep Learning, Neuroevolution).
- Ciencia de los ordenadores.
- Docencia, Aprendizaje y Tecnología - ( DAT ).
- Inteligencia Artificial.
- Soft Computing.

Miembros del grupo