Raveau Morales, María PazCabrera Valenzuela, Oscar2026-03-172026-03-172025https://hdl.handle.net/11447/10631Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data ScienceEl presente trabajo explora la viabilidad de generar resúmenes automáticos de relatos delictuales a partir de los registros del Ministerio Público de Chile, con el fin de apoyar la revisión rápida de causas y el análisis criminal. Para ello se construyó un dataset a partir de RUC con relato del hecho y su correspondiente resumen operativo (“detalle”), aplicando un proceso de limpieza que elimina glosas sin contenido real, normaliza textos y exige longitudes mínimas. Sobre este corpus, del orden de decenas de miles de registros, se definió un esquema reproducible de partición en conjuntos de entrenamiento y validación y se generaron, además, sub-datasets para los cuatro códigos de delito más frecuentes. A nivel de modelado, se entrenó un modelo T5-base general para transformar el relato completo en su resumen operativo, y luego se especializó este modelo mediante adaptadores LoRA por tipo de delito. La evaluación se realizó con métricas ROUGE (ROUGE 1, ROUGE-2 y ROUGE-L) sobre los conjuntos de validación, complementada con un análisis cualitativo de ejemplos de resúmenes generados. El modelo T5 general alcanza aproximadamente ROUGE-1 ≈ 0,30, ROUGE-2 ≈ 0,13 y ROUGE-L ≈ 0,25, lo que indica una capacidad razonable para recuperar el contenido esencial de los resúmenes humanos. Los modelos LoRA igualan o mejoran sistemáticamente estos resultados. Se concluye que es técnicamente factible entrenar modelos de resumen basados en Transformers sobre los datos actualmente disponibles en la Fiscalía y que la especialización por tipo de delito mediante LoRA aporta mejoras medibles y observables en algunos casos. El trabajo deja instalado un pipeline de datos y modelado reproducible, identifica limitaciones y propone líneas de trabajo futuro.70 p.es070037SAnálisis criminalRelatos delictualesT5LoRATransformersGeneración automática de resúmenes de relatos delictuales con modelos TransformersThesis