Bravo, LoretoGonzález Canales, Gorki Andrés2021-05-062021-05-062020-12http://hdl.handle.net/11447/4040Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data ScienceA través de la quinta versión de la Encuesta Longitudinal Empresarial de Chile se realizó el estudio de un clasificador de empresas candidatas a un crédito por parte de alguna de las diversas entidades financiera existentes en el país, para lo cual se utilizó la regresión logística de la librería Scikit-Learn de Python. Para su desarrollo, se dividió el dataset por tamaño de empresas para así considerar las variables más características de cada tamaño de empresa y se generó dos iteraciones (la primera con sus hiperparámetos por defecto y la segunda con el hiperparámetro “solver” cambiado al igual que las que dependen directamente de este), con lo cual se obtuvo que para la mayoría de los tamaños de empresa la regresión logística con sus hiperparámetros por defecto más la utilización de la técnica de penalización (hiperparámetro weight=‘balanced’ de la regresión logística) dado al desbalance de la variable objetivo, se obtiene el mejor proceso de clasificador. También, se confirma la hipótesis de “si una empresa no se encuentra bancarizada le es más complejo acceder a un crédito dado a la asimetría de la información” dado a que los coeficientes correspondientes a financiamientos de la regresión logística poseen los valores más altos.53 p.es070037SDesbalance de datosCrédito empresarialRegresión LogísticaELEPropuesta de clasificador de empresas candidatas a un crédito según los datos de la encuesta Longitudinal Empresarial de ChileThesis