Red neuronal recurrente para la clasificación automática de documentos de la comisión para el mercado financiero en Chile

Date

2021-12

Type:

Thesis

item.page.extent

47 p.

item.page.accessRights

item.contributor.advisor

ORCID:

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad del Desarrollo. Facultad de Ingeniería

item.page.isbn

item.page.issn

item.page.issne

item.page.doiurl

item.page.other

item.page.references

Abstract

La clasificación automática de documentos en categorías principales es una tarea muy importante que permite a una persona fácilmente discriminar y comprender el contenido de estos sin necesidad de intervención humana. El presente estudio propone un enfoque de recolección y clasificación de datos públicos que se encuentran publicados en la Comisión para el Mercado Financiero en adelante CMF, con la finalidad de mejorar las actuales categorías de clasificación de documentos de manera automática, bajo un enfoque de asignación de clasificaciones de manera uniforme. El problema de asignar un documento a una categoría o clase particular se ha abordado con múltiples enfoques en la literatura hasta la fecha y cuenta con numerosos avances tecnológicos nuevos. Lo que permite que los procesos relacionados con el análisis de texto y las metodologías de este aprendizaje profundo, ofrezcan una forma de resolver este escenario de clasificación con resultados sobresalientes. En el presente estudio, se propone una metodología de trabajo para realizar la obtención y clasificación automática de documentos mediante el uso de técnicas de Deep Learnig, Web Scraping y el uso de librerías como Tensorflow, NLTK y Tesseract. Las cuales al ser aplicadas en conjunto permiten poner en producción una solución de clasificación de documentos que genere valor en las organizaciones. La evaluación de la solución propuesta se realizó sobre un conjunto de datos de acceso público. Este trabajo puede ser utilizado como base de referencia para clasificar documentos de manera automática mediante la utilización de Redes Neuronales Recurrentes.

Description

Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science

item.page.coverage.spatial

item.page.sponsorship

Citation

Keywords

Clasificación de textos, Redes neuronales, CMF, Hechos esenciales, 070037S

item.page.dc.rights

item.page.dc.rights.url