Veuillez utiliser cette adresse pour citer ce document : https://hdl.handle.net/10953/1164
Titre: Modelos descriptivos basados en aprendizaje supervisado para el tratamiento de big data y flujos continuos de datos
Auteur(s): García Vico, Ángel Miguel
metadata.dc.contributor.advisor: González García, Pedro
Carmona del Jesus, Cristóbal José
metadata.dc.contributor.other: Universidad de Jaén. Departamento de Informática
Résumé: En esta tesis se analizan en profundidad las tareas de descubrimiento de subgrupos y minería de patrones emergentes enfocadas a la resolución de problemas complejos, como big data y flujos continuos de datos, entre otros. Además, se destacan diferentes problemas abiertos en este área. En particular, para descubrimiento de subgrupos se presenta un análisis de la influencia de ruido en los datos en los principales sistemas difusos evolutivos desarrollados; un paquete software para la plataforma R con los principales algoritmos basados en sistemas difusos evolutivos; y un análisis del comportamiento de los principales enfoques a problemas multi-instancia, mediante la realización de adaptaciones de los mismos. Con respecto a la minería de patrones emergentes, se presenta una revisión de los principales enfoques desarrollados en la tarea desde el punto de vista descriptivo y tres propuestas basadas en sistemas difusos evolutivos: una enfocada a mejorar la calidad del conocimiento extraído desde el punto de vista descriptivo; otra enfocada a realizar esta extracción en el ámbito big data y un último método enfocado al contexto de la minería de flujo de datos. Los resultados obtenidos muestran que los métodos propuestos permiten obtener conocimiento de calidad capaz de ayudar a la toma de decisiones por parte de los expertos en problemas complejos.
In this thesis the subgroup discovery and emerging pattern mining tasks for the resolution of complex problems, such as big data and data stream mining, among others, are analysed in depth. Different methods and tools are proposed in order to extract descriptive knowledge from these types of environments. In addition, different open problems in this area are highlighted. In particular, for subgroup discovery an analysis of the influence of data noise on the main evolutionary fuzzy systems developed is presented; a software package for the R platform with the main algorithms based on evolutionary fuzzy systems is proposed; and an initial analysis of the behaviour of the main approaches adapted to multi-instance problems, a complex problem on the rise, is shown. With respect to emerging pattern mining, a review of the main approaches developed in the task from a descriptive point of view is presented, together with three developments based on evolutionary fuzzy systems: one focused on improving the quality of the extracted knowledge from a descriptive point of view; another focused on performing this extraction in the big data domain and a last method focused on the context of data stream mining.
Mots-clés: Descubrimiento de subgrupos
sistemas difusos evolutivos
minería de patrones emergentes
big data
minería de flujo de datos
Subgroup discovery
evolutionary fuzzy systems
emerging pattern mining
big data
data stream mining
Date de publication: 2020
metadata.dc.description.sponsorship: Tesis Univ. Jaén. Departamento de Informática. Leída el 28 de abril de 2020.
Editeur: Jaén : Universidad de Jaén
ISBN: 978849159
Référence bibliographique: p.[http://hdl.handle.net/10953/]
Collection(s) :Tesis

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
TesisGARCIAVICO_Ruja.pdf2,24 MBAdobe PDFMiniature
Voir/Ouvrir


Ce document est protégé par copyright


Ce document est autorisé sous une licence de type Licence Creative Commons
Creative Commons