Please use this identifier to cite or link to this item:
https://hdl.handle.net/10953/1164
Title: | Modelos descriptivos basados en aprendizaje supervisado para el tratamiento de big data y flujos continuos de datos |
Authors: | García Vico, Ángel Miguel |
metadata.dc.contributor.advisor: | González García, Pedro Carmona del Jesus, Cristóbal José |
metadata.dc.contributor.other: | Universidad de Jaén. Departamento de Informática |
Abstract: | En esta tesis se analizan en profundidad las tareas de descubrimiento de subgrupos y minería de patrones emergentes enfocadas a la resolución de problemas complejos, como big data y flujos continuos de datos, entre otros. Además, se destacan diferentes problemas abiertos en este área. En particular, para descubrimiento de subgrupos se presenta un análisis de la influencia de ruido en los datos en los principales sistemas difusos evolutivos desarrollados; un paquete software para la plataforma R con los principales algoritmos basados en sistemas difusos evolutivos; y un análisis del comportamiento de los principales enfoques a problemas multi-instancia, mediante la realización de adaptaciones de los mismos. Con respecto a la minería de patrones emergentes, se presenta una revisión de los principales enfoques desarrollados en la tarea desde el punto de vista descriptivo y tres propuestas basadas en sistemas difusos evolutivos: una enfocada a mejorar la calidad del conocimiento extraído desde el punto de vista descriptivo; otra enfocada a realizar esta extracción en el ámbito big data y un último método enfocado al contexto de la minería de flujo de datos. Los resultados obtenidos muestran que los métodos propuestos permiten obtener conocimiento de calidad capaz de ayudar a la toma de decisiones por parte de los expertos en problemas complejos. In this thesis the subgroup discovery and emerging pattern mining tasks for the resolution of complex problems, such as big data and data stream mining, among others, are analysed in depth. Different methods and tools are proposed in order to extract descriptive knowledge from these types of environments. In addition, different open problems in this area are highlighted. In particular, for subgroup discovery an analysis of the influence of data noise on the main evolutionary fuzzy systems developed is presented; a software package for the R platform with the main algorithms based on evolutionary fuzzy systems is proposed; and an initial analysis of the behaviour of the main approaches adapted to multi-instance problems, a complex problem on the rise, is shown. With respect to emerging pattern mining, a review of the main approaches developed in the task from a descriptive point of view is presented, together with three developments based on evolutionary fuzzy systems: one focused on improving the quality of the extracted knowledge from a descriptive point of view; another focused on performing this extraction in the big data domain and a last method focused on the context of data stream mining. |
Keywords: | Descubrimiento de subgrupos sistemas difusos evolutivos minería de patrones emergentes big data minería de flujo de datos Subgroup discovery evolutionary fuzzy systems emerging pattern mining big data data stream mining |
Issue Date: | 2020 |
metadata.dc.date.submitted: | 28-Apr-2020 |
metadata.dc.description.sponsorship: | Tesis Univ. Jaén. Departamento de Informática. Leída el 28 de abril de 2020. |
Publisher: | Jaén : Universidad de Jaén |
ISBN: | 978849159 |
Citation: | p.[http://hdl.handle.net/10953/] |
Appears in Collections: | Tesis |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TesisGARCIAVICO_Ruja.pdf | 2,24 MB | Adobe PDF | ![]() View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License