Impacto de las variables socioeconómicas y demográficas en la propagación del SARS-COV-2 en la RM de Chile, con modelos Random Forest Regression y Sarimax

dc.contributor.advisorHerrera Marín, Mauricio
dc.contributor.authorLeiva Hernández, Andrés
dc.contributor.authorSánchez León, Francisco Javier
dc.coverage.spatialSantiago
dc.date.accessioned2024-02-26T17:09:25Z
dc.date.available2024-02-26T17:09:25Z
dc.date.issued2023
dc.descriptionProyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science
dc.description.abstractEl análisis exploratorio de datos de este estudio reveló una propagación inicial del COVID-19 desde el sector oriente de Santiago, caracterizado por una mejor condición económica con respecto al resto de la RM. A medida que avanzaba el tiempo, la enfermedad se expandió hacia áreas más densamente pobladas y finalmente se concentró en la zona sur, asociada a un menor ingreso per cápita. Por otro lado, la movilidad, inicialmente entre la zona sur y el centro, evolucionó hacia desplazamientos entre comunas oriente y centro. La zona central mostró mayor hacinamiento y densidad poblacional, aunque esta última se ve influenciada por áreas periféricas con baja urbanización. Al implementar un modelo Random Forest Regression se utilizaron las variables predictoras Hacinamiento, Ingreso Per Capita, Densidad Poblacional e Indice de Movilidad, en donde se identificó que el hacinamiento fue crucial en el primer periodo (entre marzo y mayo del año 2020), pero la capacidad predictiva fue limitada (R² = 0,57), esto significa que las variables exógenas del modelo no son capaces de explicar el comportamiento de la tasa de contagios. En el pick de casos (alrededor de junio y julio del año 2020), el hacinamiento y el ingreso per cápita fueron determinantes, mejorando significativamente la capacidad predictiva (R² = 0,88) y representando entre ambas variables casi un 80% el comportamiento de la tasa de contagios. En el resto del año, los ingresos ganaron relevancia en la predicción (R² = 0,98), teniendo un porcentaje de representatividad cercano al 42% por sí solo. en estos 3 periodos, el Índice de Movilidad no resultó ser determinístico en la predicción. El modelo SARIMAX, inicialmente impreciso con respecto a la amplitud de la curva pero que seguía las tendencias en cambios, este mostró mejoras al considerar dos periodos separados, uno antes del pick de casos contagiados y otro después. Con esto mejoró considerablemente la predicción, destacando que la movilidad, si bien no explicaba la mayoría de los casos por sí sola, fue un factor importante en la propagación del virus
dc.format.extent29 p.
dc.identifier.urihttps://hdl.handle.net/11447/8416
dc.language.isoes
dc.publisherUniversidad del Desarrollo. Facultad de Ingeniería
dc.subject070037S
dc.subjectPandemia
dc.subjectCovid-19
dc.subjectPropagación
dc.subjectIndicadores socioeconómicos
dc.subjectMedición
dc.titleImpacto de las variables socioeconómicas y demográficas en la propagación del SARS-COV-2 en la RM de Chile, con modelos Random Forest Regression y Sarimax
dc.typeThesis
dcterms.accessRightsAcceso abierto

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Impacto de las variables socioeconómicas y demográficas en la propagación del SARS-COV-2 en la RM de Chile.pdf
Size:
2.84 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
347 B
Format:
Item-specific license agreed upon to submission
Description: