Generación automática de resúmenes de relatos delictuales con modelos Transformers
| dc.contributor.advisor | Raveau Morales, María Paz | |
| dc.contributor.author | Cabrera Valenzuela, Oscar | |
| dc.coverage.spatial | Santiago | |
| dc.date.accessioned | 2026-03-17T20:03:44Z | |
| dc.date.available | 2026-03-17T20:03:44Z | |
| dc.date.issued | 2025 | |
| dc.description | Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science | |
| dc.description.abstract | El presente trabajo explora la viabilidad de generar resúmenes automáticos de relatos delictuales a partir de los registros del Ministerio Público de Chile, con el fin de apoyar la revisión rápida de causas y el análisis criminal. Para ello se construyó un dataset a partir de RUC con relato del hecho y su correspondiente resumen operativo (“detalle”), aplicando un proceso de limpieza que elimina glosas sin contenido real, normaliza textos y exige longitudes mínimas. Sobre este corpus, del orden de decenas de miles de registros, se definió un esquema reproducible de partición en conjuntos de entrenamiento y validación y se generaron, además, sub-datasets para los cuatro códigos de delito más frecuentes. A nivel de modelado, se entrenó un modelo T5-base general para transformar el relato completo en su resumen operativo, y luego se especializó este modelo mediante adaptadores LoRA por tipo de delito. La evaluación se realizó con métricas ROUGE (ROUGE 1, ROUGE-2 y ROUGE-L) sobre los conjuntos de validación, complementada con un análisis cualitativo de ejemplos de resúmenes generados. El modelo T5 general alcanza aproximadamente ROUGE-1 ≈ 0,30, ROUGE-2 ≈ 0,13 y ROUGE-L ≈ 0,25, lo que indica una capacidad razonable para recuperar el contenido esencial de los resúmenes humanos. Los modelos LoRA igualan o mejoran sistemáticamente estos resultados. Se concluye que es técnicamente factible entrenar modelos de resumen basados en Transformers sobre los datos actualmente disponibles en la Fiscalía y que la especialización por tipo de delito mediante LoRA aporta mejoras medibles y observables en algunos casos. El trabajo deja instalado un pipeline de datos y modelado reproducible, identifica limitaciones y propone líneas de trabajo futuro. | |
| dc.format.extent | 70 p. | |
| dc.identifier.uri | https://hdl.handle.net/11447/10631 | |
| dc.language.iso | es | |
| dc.publisher | Universidad del Desarrollo. Facultad de Ingeniería | |
| dc.subject | 070037S | |
| dc.subject | Análisis criminal | |
| dc.subject | Relatos delictuales | |
| dc.subject | T5 | |
| dc.subject | LoRA | |
| dc.subject | Transformers | |
| dc.title | Generación automática de resúmenes de relatos delictuales con modelos Transformers | |
| dc.type | Thesis | |
| dcterms.accessRights | Acceso abierto |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Generación Automática de Resúmenes de Relatos Delictuales con Modelos Transformers.pdf
- Size:
- 737.82 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 347 B
- Format:
- Item-specific license agreed upon to submission
- Description: