Generación automática de resúmenes de relatos delictuales con modelos Transformers

dc.contributor.advisorRaveau Morales, María Paz
dc.contributor.authorCabrera Valenzuela, Oscar
dc.coverage.spatialSantiago
dc.date.accessioned2026-03-17T20:03:44Z
dc.date.available2026-03-17T20:03:44Z
dc.date.issued2025
dc.descriptionProyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science
dc.description.abstractEl presente trabajo explora la viabilidad de generar resúmenes automáticos de relatos delictuales a partir de los registros del Ministerio Público de Chile, con el fin de apoyar la revisión rápida de causas y el análisis criminal. Para ello se construyó un dataset a partir de RUC con relato del hecho y su correspondiente resumen operativo (“detalle”), aplicando un proceso de limpieza que elimina glosas sin contenido real, normaliza textos y exige longitudes mínimas. Sobre este corpus, del orden de decenas de miles de registros, se definió un esquema reproducible de partición en conjuntos de entrenamiento y validación y se generaron, además, sub-datasets para los cuatro códigos de delito más frecuentes. A nivel de modelado, se entrenó un modelo T5-base general para transformar el relato completo en su resumen operativo, y luego se especializó este modelo mediante adaptadores LoRA por tipo de delito. La evaluación se realizó con métricas ROUGE (ROUGE 1, ROUGE-2 y ROUGE-L) sobre los conjuntos de validación, complementada con un análisis cualitativo de ejemplos de resúmenes generados. El modelo T5 general alcanza aproximadamente ROUGE-1 ≈ 0,30, ROUGE-2 ≈ 0,13 y ROUGE-L ≈ 0,25, lo que indica una capacidad razonable para recuperar el contenido esencial de los resúmenes humanos. Los modelos LoRA igualan o mejoran sistemáticamente estos resultados. Se concluye que es técnicamente factible entrenar modelos de resumen basados en Transformers sobre los datos actualmente disponibles en la Fiscalía y que la especialización por tipo de delito mediante LoRA aporta mejoras medibles y observables en algunos casos. El trabajo deja instalado un pipeline de datos y modelado reproducible, identifica limitaciones y propone líneas de trabajo futuro.
dc.format.extent70 p.
dc.identifier.urihttps://hdl.handle.net/11447/10631
dc.language.isoes
dc.publisherUniversidad del Desarrollo. Facultad de Ingeniería
dc.subject070037S
dc.subjectAnálisis criminal
dc.subjectRelatos delictuales
dc.subjectT5
dc.subjectLoRA
dc.subjectTransformers
dc.titleGeneración automática de resúmenes de relatos delictuales con modelos Transformers
dc.typeThesis
dcterms.accessRightsAcceso abierto

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Generación Automática de Resúmenes de Relatos Delictuales con Modelos Transformers.pdf
Size:
737.82 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
347 B
Format:
Item-specific license agreed upon to submission
Description: