Propuesta de clasificador de empresas candidatas a un crédito según los datos de la encuesta Longitudinal Empresarial de Chile
Date
2020-12
Type:
Thesis
item.page.extent
53 p.
item.page.accessRights
Authors
item.contributor.advisor
ORCID:
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad del Desarrollo. Facultad de Ingeniería
item.page.isbn
item.page.issn
item.page.issne
item.page.doiurl
item.page.other
item.page.references
Abstract
A través de la quinta versión de la Encuesta Longitudinal Empresarial de Chile se realizó el estudio de un clasificador de empresas candidatas a un crédito por parte de alguna de las diversas entidades financiera existentes en el país, para lo cual se utilizó la regresión logística de la librería Scikit-Learn de Python. Para su desarrollo, se dividió el dataset por tamaño de empresas para así considerar las variables más características de cada tamaño de empresa y se generó dos iteraciones (la primera con sus hiperparámetos por defecto y la segunda con el hiperparámetro “solver” cambiado al igual que las que dependen directamente de este), con lo cual se obtuvo que para la mayoría de los tamaños de empresa la regresión logística con sus hiperparámetros por defecto más la utilización de la técnica de penalización (hiperparámetro weight=‘balanced’ de la regresión logística) dado al desbalance de la variable objetivo, se obtiene el mejor proceso de clasificador. También, se confirma la hipótesis de “si una empresa no se encuentra bancarizada le es más complejo acceder a un crédito dado a la asimetría de la información” dado a que los coeficientes correspondientes a financiamientos de la
regresión logística poseen los valores más altos.
Description
Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo
para optar al grado académico de Magíster en Data Science
item.page.coverage.spatial
item.page.sponsorship
Citation
Keywords
070037S, Desbalance de datos, Crédito empresarial, Regresión Logística, ELE