Aplicación de modelos de clasificación para predecir la continuación de estudios superiores
Date
2023
Type:
Thesis
item.page.extent
37 p.
item.page.accessRights
Privado
Authors
item.contributor.advisor
ORCID:
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad del Desarrollo. Facultad de Ingeniería
item.page.isbn
item.page.issn
item.page.issne
item.page.doiurl
item.page.other
item.page.references
Abstract
En el contexto de la educación superior chilena, la Universidad del Desarrollo (UDD) cuenta con una población estudiantil diversa en sus programas de pregrado. Como en muchas instituciones, la UDD enfrenta el desafío de comprender mejor las trayectorias profesionales y académicas de sus egresados. Este estudio se centra en analizar los patrones de continuación de estudios de posgrado entre los graduados de la UDD, utilizando datos de encuestas realizadas a una muestra representativa de 29.000 alumnos que completaron programas de pregrado.
El objetivo principal de este trabajo es desarrollar un modelo predictivo que pueda identificar los factores determinantes en la decisión de los egresados de continuar con estudios de posgrado. A través de la aplicación de técnicas de Machine Learning, incluyendo Random Forest, Regresión Logística, Gradient Boosting, SVC (Support Vector Classifier) y KNN (K-Nearest Neighbors), el estudio busca descubrir las relaciones subyacentes entre el rendimiento académico, las circunstancias socioeconómicas y la posterior elección de emprender estudios avanzados.
Mediante el uso de un conjunto de datos que abarcó respuestas a encuestas, tanto de preguntas cerradas como abiertas, se logró predecir con precisión la decisión de los estudiantes de cursar estudios de posgrado. Entre los modelos evaluados, se destacó especialmente el modelo de Regresión logística, que demostró un rendimiento sólido con métricas de precisión y puntuación F1 que indican su capacidad para clasificar de manera acertada a los individuos según su probabilidad de inscribirse en programas de posgrado. La validación de estos modelos se llevó a cabo a través del análisis de la curva ROC, lo que respalda la confiabilidad de las predicciones realizadas en este estudio.
Description
Capstone presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science
item.page.coverage.spatial
Santiago
item.page.sponsorship
Citation
Keywords
070037S, Estudiantes universitarios, Continuidad de estudios