Red neuronal recurrente para la clasificación automática de documentos de la comisión para el mercado financiero en Chile
Date
2021-12
Type:
Thesis
item.page.extent
47 p.
item.page.accessRights
Authors
item.contributor.advisor
ORCID:
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad del Desarrollo. Facultad de Ingeniería
item.page.isbn
item.page.issn
item.page.issne
item.page.doiurl
item.page.other
item.page.references
Abstract
La clasificación automática de documentos en categorías principales es una tarea muy importante que permite a una persona fácilmente discriminar y comprender el contenido de estos sin necesidad de intervención humana. El presente estudio propone un enfoque de recolección y clasificación de datos públicos que se encuentran publicados en la Comisión para el Mercado Financiero en adelante CMF, con la finalidad de mejorar las actuales categorías de clasificación de documentos de manera automática, bajo un enfoque de asignación de clasificaciones de manera uniforme. El problema de asignar un documento a una categoría o clase particular se ha abordado con múltiples enfoques en la literatura hasta la fecha y cuenta con numerosos avances tecnológicos nuevos. Lo que permite que los procesos relacionados con el análisis de texto y las metodologías de este aprendizaje profundo, ofrezcan una forma de resolver este escenario de clasificación con resultados sobresalientes. En el presente estudio, se propone una metodología de trabajo para realizar la obtención y clasificación automática de documentos mediante el uso de técnicas de Deep Learnig, Web Scraping y el uso de librerías como Tensorflow, NLTK y Tesseract. Las cuales al ser aplicadas en conjunto permiten poner en producción una solución de clasificación de documentos que genere valor en las organizaciones. La evaluación de la solución propuesta se realizó sobre un conjunto de datos de acceso público. Este trabajo puede ser utilizado como base de referencia para clasificar documentos de manera automática mediante la utilización de Redes Neuronales Recurrentes.
Description
Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science
item.page.coverage.spatial
item.page.sponsorship
Citation
Keywords
Clasificación de textos, Redes neuronales, CMF, Hechos esenciales, 070037S