Biomedical entities recognition in Spanish combining word embeddings
dc.contributor.advisor | L. Alfonso, Ureña López | |
dc.contributor.advisor | Martín Valdivia, María Teresa | |
dc.contributor.advisor | Díaz Galiano, Manuel Carlos | |
dc.contributor.author | López Úbeda, Pilar | |
dc.contributor.other | Universidad de Jaén. Departamento de Informática | es_ES |
dc.date.accessioned | 2021-05-16T19:05:51Z | |
dc.date.available | 2021-05-16T19:05:51Z | |
dc.date.issued | 2021-04-22 | |
dc.description.abstract | El reconocimiento de entidades con nombre (NER) es una tarea importante en el campo del Procesamiento del Lenguaje Natural que se utiliza para extraer conocimiento significativo de los documentos textuales. El objetivo de NER es identificar trozos de texto que se refieran a entidades específicas. En esta tesis pretendemos abordar la tarea de NER en el dominio biomédico y en español. En este dominio las entidades pueden referirse a nombres de fármacos, síntomas y enfermedades y ofrecen un conocimiento valioso a los expertos sanitarios. Para ello, proponemos un modelo basado en redes neuronales y empleamos una combinación de word embeddings. Además, nosotros generamos unos nuevos embeddings específicos del dominio y del idioma para comprobar su eficacia. Finalmente, demostramos que la combinación de diferentes word embeddings como entrada a la red neuronal mejora los resultados del estado de la cuestión en los escenarios aplicados. | es_ES |
dc.description.abstract | Named Entity Recognition (NER) is an important task in the field of Natural Language Processing that is used to extract meaningful knowledge from textual documents. The goal of NER is to identify text fragments that refer to specific entities. In this thesis we aim to address the task of NER in the Spanish biomedical domain. In this domain entities can refer to drug, symptom and disease names and offer valuable knowledge to health experts. For this purpose, we propose a model based on neural networks and employ a combination of word embeddings. In addition, we generate new domain- and language-specific embeddings to test their effectiveness. Finally, we show that the combination of different word embeddings as input to the neural network improves the state-of-the-art results in the applied scenarios. | es_ES |
dc.description.sponsorship | Tesis Univ. Jaén. Departamento de Informática. Leída el 22 abril de 2021. | es_ES |
dc.identifier.citation | p.[http://hdl.handle.net/10953/] | es_ES |
dc.identifier.isbn | 978849159 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10953/1094 | |
dc.language.iso | spa | es_ES |
dc.publisher | Jaén : Universidad de Jaén | es_ES |
dc.rights | Licencia Reconocimiento-NoComercial-SinObraDerivada 3.0 España | es_ES |
dc.rights | Atribución-NoComercial-SinDerivadas 3.0 España | * |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.subject | Procesamiento del Lenguaje Natural | es_ES |
dc.subject | aprendizaje profundo | es_ES |
dc.subject | representación de palabras | es_ES |
dc.subject | corpus en español | es_ES |
dc.subject | reconocimiento de entidades biomédicas | es_ES |
dc.subject | Natural Language Processing | es_ES |
dc.subject | deep learning | es_ES |
dc.subject | Spanish corpora | es_ES |
dc.subject | biomedical entity recognition | es_ES |
dc.subject | word embeddings | es_ES |
dc.subject.udc | 120304 Inteligencia Artificial | es_ES |
dc.subject.udc | 120317 Informática | es_ES |
dc.title | Biomedical entities recognition in Spanish combining word embeddings | es_ES |
dc.type | info:eu-repo/semantics/doctoralThesis | es_ES |
europeana.dataProvider | Universidad de Jaén. España | es_ES |
europeana.rights | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | es_ES |
europeana.type.TEXT | TEXT | es_ES |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Thesis_plubeda.pdf
- Tamaño:
- 1.95 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 1.98 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: