Ferres, LeoJara Aburto, Juan Francisco2022-01-122022-01-122021-12http://hdl.handle.net/11447/5445Tesis presentada a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data ScienceEste trabajo busca entender si es posible identificar a aquellas empresas productivas que pueden llegar a convertirse en PyME (pequeñas y medianas empresas van desde 2.400 UF hasta 100.000 UF de venta anual) basándose en información tributaria disponible en Servicio de Impuestos Internos. Esta información es útil para segmentar clientes empresas y ofrecerles desde un inicio una oferta de productos apropiada para apoyar el crecimiento, por ejemplo, desde la industria bancaria. La segmentación de una microempresa con potencial de convertirse en PyME y de una microempresa destinada a seguir como tal, es inherentemente distinta, tanto como en oferta de valor, modelo de atención, riesgo de default esperado en caso de otorgarles un crédito, etc. Poder identificarlas con antelación puede suponer una ventaja competitiva importante para una empresa B2B. El mejor resultado obtenido fue mediante XGBoost preprocesando la data categórica con WoE Encoding y calibrando hiperparámetros con el algoritmo Subplex. Se obtuvo un AUC PR de un 45,43% en un set de test. Los resultados de estas predicciones fueron analizados mediante SHAP Values, donde la Actividad Económica de la empresa es la que más incide en la variabilidad final de la decisión del modelo. El modelo seleccionado posee un ECE de un 0,59%, lo cual indica que las probabilidades obtenidas se encuentran bien calibradas y pueden ser utilizadas para estimar utilidades esperadas.113 p.esEmprendimientoEmpresasInformación tributaria070037SModelo Emprendedor. Basado en Información TributariaThesis