Impacto de las variables socioeconómicas y demográficas en la propagación del SARS-COV-2 en la RM de Chile, con modelos Random Forest Regression y Sarimax
Date
2023
Type:
Thesis
item.page.extent
29 p.
item.page.accessRights
Acceso abierto
item.contributor.advisor
ORCID:
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad del Desarrollo. Facultad de Ingeniería
item.page.isbn
item.page.issn
item.page.issne
item.page.doiurl
item.page.other
item.page.references
Abstract
El análisis exploratorio de datos de este estudio reveló una propagación inicial del COVID-19 desde el sector oriente de Santiago, caracterizado por una mejor condición económica con respecto al resto de la RM. A medida que avanzaba el tiempo, la enfermedad se expandió hacia áreas más densamente pobladas y finalmente se concentró en la zona sur, asociada a un menor ingreso per cápita. Por otro lado, la movilidad, inicialmente entre la zona sur y el centro, evolucionó hacia desplazamientos entre comunas oriente y centro. La zona central mostró mayor hacinamiento y densidad poblacional, aunque esta última se ve influenciada por áreas periféricas con baja urbanización.
Al implementar un modelo Random Forest Regression se utilizaron las variables predictoras Hacinamiento, Ingreso Per Capita, Densidad Poblacional e Indice de Movilidad, en donde se identificó que el hacinamiento fue crucial en el primer periodo (entre marzo y mayo del año 2020), pero la capacidad predictiva fue limitada (R² = 0,57), esto significa que las variables exógenas del modelo no son capaces de explicar el comportamiento de la tasa de contagios. En el pick de casos (alrededor de junio y julio del año 2020), el hacinamiento y el ingreso per cápita fueron determinantes, mejorando
significativamente la capacidad predictiva (R² = 0,88) y representando entre ambas variables casi un 80% el comportamiento de la tasa de contagios. En el resto del año, los ingresos ganaron relevancia en la predicción (R² = 0,98), teniendo un porcentaje de representatividad cercano al 42% por sí solo. en estos 3 periodos, el Índice de Movilidad no resultó ser determinístico en la predicción.
El modelo SARIMAX, inicialmente impreciso con respecto a la amplitud de la curva pero que seguía las tendencias en cambios, este mostró mejoras al considerar dos periodos separados, uno antes del pick de casos contagiados y otro después. Con esto mejoró considerablemente la predicción, destacando que la movilidad, si bien no explicaba la mayoría de los casos por sí sola, fue un factor importante en la propagación del virus
Description
Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science
item.page.coverage.spatial
Santiago
item.page.sponsorship
Citation
Keywords
070037S, Pandemia, Covid-19, Propagación, Indicadores socioeconómicos, Medición