Tesis de Postgrado Ingeniería
Permanent URI for this collection
Browse
Browsing Tesis de Postgrado Ingeniería by Subject "070037S"
Now showing 1 - 20 of 93
Results Per Page
Sort Options
Item Ajuste de la distribución probabilística y construcción de data sintética de XDR´S(Universidad del Desarrollo. Facultad de Ingeniería, 2022) Díaz Letelier, Alberto; Vásquez Herrera, Elizabeth; Bravo, Loreto; Ferres, LeonardoEl patrón temporal de registros de usos de datos entrega información de utilidad para las compañías de telecomunicaciones (TELCO), donde se detecta tiempo critico de tráfico de datos de sus clientes. Este es un indicador que permite mejorar la calidad del servicio junto con detectar los tramos críticos en los que se recomienda optimizar el servicio, dado que, fallas eventuales en el periodo de mayor uso de datos traería reclamos a la compañía, lo que afectaría a los índices de satisfacción. Por ello nos embarcamos en este proyecto que tiene como motivación caracterizar y describir las series de XDRs en distintos tiempos comparando comportamientos de distribuciones, y al mismo tiempo, distinguir el tramo de horario de mayor actividad mediante las conexiones de sus clientes capturadas por hits en las antenas, y dada la información conocida, predecir un día de actividad a partir de 3 días conocidos. Con ello se podrá establecer y reconocer futuros puntos críticos, información valiosa para preparar medidas de contingencia previstas ante el alza de conexiones.Item Algoritmos de comparación para elegir un automóvil. Las personas compran autos chinos como su primera opción.(Universidad del Desarrollo. Facultad de Ingeniería, 2022) Cestari Osal, Verónica; Lobos Muñoz, Adolfo Andrés; Candia, CristianEste documento muestra cómo podemos determinar la preferencia de los consumidores Chilenos para comprar un vehículo de procedencia China por sobre el de otro país. Las costumbres apuntan que las personas son tradicionales en nuestro país y cuando un producto nuevo ingresa al mercado se hace difícil su penetración y esto no ha sido la excepción de los vehículos de origen Chino.Item Análisis a la red de compras de organismos públicos de Chile(Universidad del Desarrollo. Facultad de Ingeniería, 2020-12) Salgado Rojas, Felipe Esteban; Kim, HetaeeMercado Público es una plataforma web bipartita, en donde interactúan distintos organismos públicos de Chile y proveedores registrados en ella, con el fin de gestionar sus compras, básicamente la adquisición de bienes u obtención de servicios. Comúnmente, el proceso para adquirir productos y/o servicios, es a través de una licitación pública o una orden de compra (dependiendo el monto), generadas por la entidad gubernamental que lo requiera. Aunque la información que se puede obtener en esta plataforma es basta, no existen muchos estudios que analicen desde un punto de vista matemático, cómo se relacionan los distintos proveedores y entidades de gobierno ni como se destinan los recursos públicos a sus distintas áreas (salud, transporte, educación, entre otras). Es por ello, que el objetivo general de este estudio será verificar de forma cuantitativa cómo es la distribución de recursos monetarios para compras públicas en un rango de los últimos 3 años y así, comprobar si las compras son adjudicadas a la mayoría de los proveedores inscritos o a algunos solamente (comunidades cerradas). Para lograr lo anterior, en este estudio se utilizarán las herramientas y bases matemáticas detalladas de la teoría de grafos para: detección de comunidades, hub y dispersión de la red, identificando el comportamiento y distribución de los miembros de ella. Este análisis no sólo se analiza por año, sino que también se apertura en base a la clasificación actual de licitaciones públicas por montos: desde aquellas con montos menores a 100 UTM hasta las grandes compras superiores a 5.000 UTM. Al hacer este análisis detallado se busca identificar patrones y/o diferencias entre las redes por año y tipo, identificando eventualmente la existencia de comunidades cerradas con proveedores particulares y las áreas preponderantes en las comunidades detectadas. Adicional a lo anterior, se realiza un análisis de red para comprobar la interacción entre cada una de las comunidades identificadas anteriormente, lo cual llamaremos en este estudio como “super comunidades”, éstas podrán dar luces de algún patrón complementario. Como últimas medidas para poder cumplir con el objetivo del estudio y considerando la naturaleza de esta red, se efectúa un análisis de red bipartita y las distintas proyecciones de compradores y proveedores, lo cual permitirá identificar el comportamiento, por ejemplo, de un comprador en la red compuesta sólo por organismos del Estado, permitiendo determinar quienes de ellos son más preponderantes en la red. Para finalizar, en base a todos los resultados y casos planteados en este estudio, se obtendrán las conclusiones necesarias para determinar si la hipótesis planteada es válida o no.Item Análisis comparativo de manipulación de resultados en agregación de preferencias de políticas públicas: Estudio a partir de datos de Chile, Brasil y Francia(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Quijada Espinoza, Catalina; Candia Vallejos, CristianEl surgimiento de la democracia digital trae consigo oportunidades para fortalecer la participación ciudadana, aunque tampoco está exento de riesgos. El presente estudio tiene como objetivo analizar las características que influyen en la manipulación de rankings de agregación de preferencias, en un contexto de democracia digital. Para esto, se utilizaron datos de Chile, Brasil y Francia, obtenidos a partir de plataformas web de participación ciudadana, donde se solicitaba a los votantes elegir entre pares de propuestas de políticas públicas. El principal resultado indica que las personas que se identifican con la izquierda son más propensas a la manipulación de los rankings. Estos hallazgos permiten conocer ciertas limitaciones de los procesos de democracia digital, enfatizando la importancia de tomar precauciones para evitar que la democracia se vea debilitada.Item Análisis comparativo sobre indicadores de movilidad para la zona central de Chile durante la pandemia: Exploración de diferencias entre grupos socioeconómicos y propuesta de modelo predictivo (SVR) para el índice de movilidad interno(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Fuentes Navarro, Ignacio; Orellana Montecino, David; Ferres, LeoLa presente investigación intenta aportar al entendimiento de la inercia de movilidad de la población, especialmente ante situaciones de alta complejidad como lo fue la pandemia de COVID – 19 y las medidas no farmacológicas que se aplicaron en Chile para restringir el libre desplazamiento. Para este análisis, se utilizaron datos detallados de los Índices de Movilidad (IM) construidos por Instituto Data Science de la UDD, y facilitados al Ministerio de Ciencia, los cuales se encuentran desglosados en índices internos (referentes a viajes dentro de la comuna) e índices externos (considerando desplazamientos entre comunas), así como la sumatoria de ambos como un indicador de movilidad total (IM). Uno de los resultados más significativos de esta investigación es la correlación negativa entre el índice de Movilidad interno y los niveles socioeconómicos de las comunas. Este hallazgo sugiere que factores como el ingreso y la situación económica local desempeñan un papel crucial en la configuración de los patrones de movilidad. Esta comprensión pudiese ser fundamental a la hora de diseñar estrategias de manejo de la movilidad que sean efectivas, equitativas y sensibles a las disparidades socioeconómicas. También, se desarrolla un modelo predictivo utilizando Regresión de Vectores de Soporte (SVR), que pretende ser una herramienta eficaz para predecir el índice de movilidad interno (IM_interno). El modelo se entrena con datos de comunas en la zona central de Chile, utilizando variables clave como la densidad poblacional (población/superficie en Km2) y el porcentaje de pobreza. El modelo destaca la importancia de considerar estas variables en la formulación de políticas de gestión de la movilidad. En conclusión, este estudio intenta ofrecer una visión más completa y contextualizada de la movilidad durante los tiempos de cuarentena, integrando datos cuantitativos y comprensión cualitativa de los factores subyacentes, especialmente el porcentaje de población en situación de pobreza.Item Análisis de Redes para Market Basket: Experiencia práctica con Big Data en una empresa de Retail Chilena(Universidad del Desarrollo. Facultad de Ingeniería, 2020-11) Grunert Gómez, Martín Arnaldo; Kim, HeetaeEn este estudio se propone una metodología con análisis de redes para realizar un Market Basket Analysis a nivel de producto en una empresa de retail chilena. Se utiliza un algoritmo de detección de comunidades para estudiar los grupos que se generan durante tres trimestres del 2020 y como ha cambiado la red temporal a través del tiempo. La metodología propuesta, contempla la creación de una red producto-producto, que va desde el procesamiento de los datos transaccionales, pasando por una matriz de coocurrencia, hasta la creación de un grafo con la aplicación de algoritmo de detección de comunidades. Se observa que las comunidades del primer trimestre del 2020 tienen un cambio significativo comparado con el segundo y tercer trimestre por los efectos de la pandemia y el retiro de las AFP. También, es interesante observar que cada comunidad tiene una composición interpretable a las distintas ocasiones de consumo de los clientes. Por último, a pesar de lograr una modularidad cercana a la literatura, esta sigue siendo baja y da para concluir que existe un patrón no modular en la red, donde los patrones de consumo de los clientes son todos distintos.Item Análisis de textos utilizando técnicas de NLP: Análisis de las respuestas de los ciudadanos que participaron en la iniciativa “El Chile que Queremos”(Universidad del Desarrollo. Facultad de Ingeniería, 2024) Herrera Rojas, Claudia Angélica; Raveau, María PazEl "Estallido social" de octubre de 2019 fue un reflejo de la insatisfacción de los ciudadanos frente al modelo actual. En respuesta, iniciativas como "El Chile que Queremos" (ECQQ) surgieron para iniciar un proceso de escucha social a través de diálogos ciudadanos. El presente trabajo se enfoca en analizar las respuestas de ECQQ para comprender las percepciones de los ciudadanos sobre las necesidades del país y las emociones experimentadas después de octubre de 2019 . Se aplicó Latent Dirichlet Allocation (LDA) para identificar áreas de interés, evidenciando la consistencia de estos resultados con otros estudios realizados en el país sobre el estallido social. Las emociones predominantes fueron el miedo y la tristeza, especialmente entre las personas mayores. Sin embargo, la esperanza también se destacó, particularmente entre los jóvenes. A través del cálculo del coeficiente V de Cramér se evidenció una asociación débil entre temas dominantes y categorías de emociones, debido a la heterogeneidad presente en estas categorías.Item Análisis de Valor de Vida Geográfico (GLV): Evaluación estratégica de zonas comerciales mediante datos transaccionales y sociodemográficos(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Gaete Obreque, Claudio; Soto Rosales, Camila; Opitz, DanielaLa motivación para llevar a cabo esta tesis de magíster radica en la creciente necesidad de comprender y aprovechar eficazmente el potencial económico y comercial de diferentes zonas geográficas. En un mundo donde la toma de decisiones basada en datos se ha convertido en un imperativo, la determinación del “lifetime value” de áreas geográficas específicas se ha convertido en un desafío estratégico fundamental para empresas, gobiernos y emprendedores.Item Análisis del impacto de la densidad y variedad de servicios urbanos en la afluencia de pasajeros en la red de transporte público de la Región Metropolitana(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Guzmán Vargas, Felipe; Vigorena Cortés, Effry; Opitz, DanielaEn este capstone se realizó un análisis del impacto de la densidad y variedad de servicios urbanos en la afluencia de pasajeros en la red de transporte público de la Región Metropolitana. El objetivo fue identificar si los servicios de infraestructura son un factor decisivo para los usuarios de transporte público en un paradero específico. Para ello, se utilizó una extracción y transformación de datos con herramientas de BigData para manejar grandes volúmenes de datos de manera eficiente. Se realizó un Análisis Exploratorio de Datos (EDA) que reveló patrones y tendencias clave, fundamentales para el modelado predictivo, como la distribución geográfica desigual y su relación con diferentes tipos de servicios urbanos. A través de la comparación de distintos modelos de machine learning, se identificó el tipo de modelo que tiene un mejor ajuste a las características asociadas al paradero, como la ubicación geográfica, el tiempo de viaje y otras variables que tienen un impacto decisivo en el número de pasajeros que utilizan un paradero específico. Esto refleja tanto la afluencia de pasajeros como el número de viajes que salen desde ese paradero (demanda). Estos resultados no solo confirman la utilidad de los modelos de machine learning en el análisis del transporte público, sino que también como estos pueden aportar conocimientos esenciales para mejorar la planificación en la gestión de sistemas de transporte urbano que pudiesen lograr una movilidad más eficiente y sostenible en las ciudades.Item Análisis del liderazgo femenino en las Instituciones Públicas en el Estado de Chile(Universidad del Desarrollo. Facultad de Ingeniería, 2022-01) Rebolledo Fuentes, Jorge Eduardo; Bravo, LoretoIn the last decades, the female role has been had increasingly growing in all aspects of society. This is evidenced looking at their presence in academic institutes, their management positions on enterprises, their presence on state functions, and so on. In this study, we compare men's leadership and women's leadership through a tool named Multidirectional Measurement of Leadership (MML). The first phase of the project consists of collecting data about leaders’ characteristics like proactivity, discipline, perseverance, etc. All of them focused on a perspective of a peer, a superior, a subordinate, and an autoevaluation of people in a Chilean government organization. This data is accompanied by personal data like age, if the person has children, and the person’s occupation. The second part consists of developing comparisons of all collected data with the help of graphs, descriptive statistics, and hypothesis testings. Results of these comparisons tell us in what conditions males and females have the same level of leadership (according to the defined leaders’ characteristics) and in which notItem Análisis y Modelamiento de los márgenes por negocios de la Empresa Derco mediante series temporales y redes neuronales recurrentes LSTM(Universidad del Desarrollo. Facultad de Ingeniería, 2022) Álvarez Vallejos, Jonathan; Soto Sandoval, Patricio; Astroza, Alonso; Candia Vallejos, CristiánEl objetivo de este proyecto es analizar y modelar los márgenes por negocio de la empresa DERCO mediante series temporales y redes neuronales recurrentes. Bajo la hipótesis a comprobar respecto a la relación en el aumento del margen de vehículos nuevos sobre el margen de ganancia de las unidades de negocio restantes. Se exploraron los registros de venta de los últimos 12 años, logrando plantear correlaciones e identificar patrones para el posterior modelamiento. Los modelos de las series fueron realizados por medio de Prophet y RNN LSTM. Se obtuvo como principal resultado que los modelos elaborados con Prophet, presentan un mejor desempeño para el caso en estudio, considerando las limitaciones de tiempo, recursos e información disponible. De ello podemos concluir que para este caso particular, la influencia del margen de venta de los vehículos nuevos es muy relevante para el margen de las otras unidades de negocio. Como mejora al análisis y modelamiento se propone explorar el detalle de venta (productos) por cliente y efectuar nuevos modelos de redes neuronales probando otras arquitecturas.Item Análisis y perfilamiento en torno a la eficiencia legislativa de la cámara de diputadas y diputados en Chile(Universidad del Desarrollo. Facultad de Ingeniería, 2020-11) Alvarado Bustos, Josué Maximiliano; Kim, HeetaeEl Análisis y Perfilamiento en torno a la Eficiencia Legislativa de la Cámara de Diputadas y Diputados en Chile tiene por objetivo ser un estudio en base a componentes de inteligencia artificial que entregue a la ciudadanía, información útil y de fácil comprensión acerca de elementos claves en la labor del poder legislativo. Utilizando información pública y de libre acceso, sobre la labor diaria de cada diputada y diputado, se procesó y tradujo esta información en conocimientos, expresados en patrones de desempeño que existen en la actualidad. Junto a esto, la cantidad de parlamentarios que ejercen su rol legislativo bajo ese patrón. El resultado fue la presentación de cuatro agrupaciones de parlamentarios y características que los distinguen o diferencian del resto, analizando detalladamente los elementos que podrían permitir evaluar y calificar el desempeño de cada legislador, siendo los insigth de este estudio los primeros pasos para definir un sistema de medición transparente y sin sesgos ideológicos, pensando en elecciones futuras de nuevos representantes y la continuidad de los ya elegidos democráticamente por la ciudadanía. Ya inmersos en plena cuarta revolución industrial, marcada por la era del conocimiento, los desafíos que nos depara el siglo XXI como sociedad, sin duda requiere una labor política por parte del poder legislativo de excelencia, para lograrlo será clave una constante evaluación del desempeño y eficiencia en el proceso legislativo de cada diputada y diputado. Este estudio espera ser el puntapié inicial de este desafío.Item Aplicación de modelos de clasificación para predecir la continuación de estudios superiores(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Aroca Guerrero, Leandro; Bravo Celedón, María LoretoEn el contexto de la educación superior chilena, la Universidad del Desarrollo (UDD) cuenta con una población estudiantil diversa en sus programas de pregrado. Como en muchas instituciones, la UDD enfrenta el desafío de comprender mejor las trayectorias profesionales y académicas de sus egresados. Este estudio se centra en analizar los patrones de continuación de estudios de posgrado entre los graduados de la UDD, utilizando datos de encuestas realizadas a una muestra representativa de 29.000 alumnos que completaron programas de pregrado. El objetivo principal de este trabajo es desarrollar un modelo predictivo que pueda identificar los factores determinantes en la decisión de los egresados de continuar con estudios de posgrado. A través de la aplicación de técnicas de Machine Learning, incluyendo Random Forest, Regresión Logística, Gradient Boosting, SVC (Support Vector Classifier) y KNN (K-Nearest Neighbors), el estudio busca descubrir las relaciones subyacentes entre el rendimiento académico, las circunstancias socioeconómicas y la posterior elección de emprender estudios avanzados. Mediante el uso de un conjunto de datos que abarcó respuestas a encuestas, tanto de preguntas cerradas como abiertas, se logró predecir con precisión la decisión de los estudiantes de cursar estudios de posgrado. Entre los modelos evaluados, se destacó especialmente el modelo de Regresión logística, que demostró un rendimiento sólido con métricas de precisión y puntuación F1 que indican su capacidad para clasificar de manera acertada a los individuos según su probabilidad de inscribirse en programas de posgrado. La validación de estos modelos se llevó a cabo a través del análisis de la curva ROC, lo que respalda la confiabilidad de las predicciones realizadas en este estudio.Item Aplicación Web: Integración de modelo GPT-4 turbo a Dashboard basado en Streamlit: Análisis de empleabilidad y continuidad de estudios en alumni UDD(Universidad del Desarrollo. Facultad de Ingeniería, 2024) Bello Carrillo, Felipe; Bravo Celedón, María LoretoLos Modelos de Lenguaje Grandes (LLM) han experimentado un avance significativo en los últimos años gracias al desarrollo de nuevas tecnologías especializadas en el entrenamiento de modelos de inteligencia artificial. Estos desarrollos han contribuido a que estos modelos sean más accesibles que nunca. Uno de los modelos actuales más avanzados es GPT-4 Turbo de la empresa OpenAI, el cual, debido a su gran complejidad, es ideal para realizar análisis de datos. Durante el primer semestre del año 2023, se llevó a cabo la encuesta de actualización de alumni de la Universidad del Desarrollo, en la cual se logró recopilar los datos de 29,533 exalumnos de la universidad. El objetivo principal de este proyecto es realizar un análisis de datos enfocándose en la empleabilidad y la continuidad de estudios de postgrado y diseñar e implementar una aplicación web basada en Streamlit para que usuarios puedan realizar estos análisis. La aplicación consta de dos subaplicaciones: un dashboard y un chatbot potenciado por GPT-4 Turbo. El dashboard proporciona visualizaciones detalladas junto con un análisis comprensivo de los datos, mientras que el chatbot permite a los usuarios realizar consultas más específicas que se tengan con respecto a estos. Realizando el análisis de los datos pudimos identificar que sí existe una importante relación entre los estudios de postgrado con la empleabilidad, así como que existe una gran dispersión en el porcentaje de empleabilidad para las distintas carreras de pregrado.Item Aproximación a determinantes sobre el resultado de un partido de fútbol y ranking de jugadores del campeonato nacional chileno: Predicción, Clasificación y Ranking(Universidad del Desarrollo. Facultad de Ingeniería, 2022) Nina Yanarico, Miguel Alejandro; Bravo, Loreto; Contreras, HugoEn el contexto del fútbol nacional y como cualquier actividad de competición de alto rendimiento el resultado de los encuentros entre 2 rivales depende de varios factores que solo pueden ser identificados al interior de una cancha de fútbol. En un contexto general, cada partido los jugadores, directores técnicos, árbitros, incluso hasta los hinchas forman un escenario de competencia y rivalidad, por otro lado las cualidades únicas de cada jugador representan un factor determinante para la victoria, derrota o empate del equipo. En este trabajo se presentarán tres enfoques usando datos que se generan en cada partido de fútbol y datos de los jugadores de los distintos campeonato en Chile, Primero, se expondrá el origen y detalle de cada variable acompañado de un análisis exploratorio de datos. En segundo lugar se implementaran metodologías de Machine Learning para seleccionar estadísticamente aquellas variables representan la victoria, derrota o empate de los equipos y en tercer lugar, con las variables seleccionadas y compatibles con las variables del jugador se valorizara y creará un ranking de los jugadores de fútbol chileno.Item AquaTendencias Maipo: Una radiografía a las zonas de la cuenca(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Rivera Piñones, Nicolás; Herrera Marín, MauricioEl presente estudio, enfocado en la cuenca del río Maipo en la Región Metropolitana de Santiago, Chile, aborda la creciente preocupación por la seguridad hídrica en un contexto marcado por la variabilidad y el cambio climático. La investigación se centra en la posibilidad de que los patrones climáticos históricos y los datos meteorológicos como las precipitaciones puedan ser indicativos para la predicción de períodos secos (dry-spell) en la cuenca del río Maipo, reconociendo la alta variabilidad y complejidad inherente a los sistemas meteorológicos. Los dryspell, definidos como períodos prolongados sin precipitaciones significativas menor a 1mm, son de alta importancia en áreas donde la agricultura es altamente dependiente de la lluvia, estos períodos secos son cruciales para entender y anticipar sequías más severas. Este proyecto se enfoca en la Región del Maipo, que compende 14.939 km², incluye 23 estaciones fluviométricas, y se inscribe en un contexto desafiante debido a una sequía persistente y una demanda creciente de recursos hídricos que son cada vez más limitados. Este escenario subraya la necesidad de planificación exhaustiva y estrategias adaptativas en la gestión de recursos hídricos, actividades que son vitales para el sector agrícola y entidades privadas que requieren un manejo eficiente y sostenible del agua. La metodología utilizada en este estudio combina el análisis de datos hidroclimáticos con modelos estadísticos y de aprendizaje profundo para explorar tendencias y patrones en las precipitaciones durante más de 20 años. El uso de modelos estadísticos y de Deep Learning brindan una perspectiva cuantitativa esencial para la toma de decisiones informadas, utilizando por ejemplo herramientas como el Test de Mann-Kendall y el cálculo de índices como el SPI y SDII sobre series de tiempo de precipitaciones. Este trabajo reconoce la complejidad de un sistema que entrelaza lo hidroclimático, social, ambiental y territorial, proponiendo un enfoque sistémico para abordar estos aspectos y alinear los resultados con las necesidades de adaptación al cambio climático y la optimización de la gestión del agua. Los hallazgos y recomendaciones presentados buscan contribuir a la construcción de un futuro más resiliente y seguro en términos hídricos para la región más poblada de ChileItem Automatización del análisis de imágenes para experimentos de ensayos de herida(Universidad del Desarrollo. Facultad de Ingeniería, 2022-01) Urrejola Barrios, Sebastián Andrés; Opitz, Daniela; Lobos-González, LorenaUn ensayo que aborda el comportamiento tumoral de una célula muy establecido en las ciencias biológicas es el ensayo de migración celular. De este tipo de ensayo uno de los más comunes y simples es el ensayo de migraciones en dos dimensiones, donde lo que se hace es evaluar en el plano eje X como un área no ocupada de células, puede ser repoblada por células que se movilizan. A partir de estos experimentos se obtienen fotografías desde donde se analizan las propiedades migratorias de grupos colectivos de células. Hacer estos análisis de forma manual es una tarea que consume considerables cantidades de tiempo para las personas haciendo estas investigaciones y genera un resultado sujeto al ejecutor. En este trabajo presentamos dos métodos distintos para la automatización de este proceso. El primer método se basa en detección de contornos para así identificar la región libre de células, mientras que el segundo método se basa en detección de texturas pasa clasificar los píxeles de las imágenes. Hasta el momento ejecutando el segundo método se logra procesar imágenes en aproximadamente un 80 % del tiempo que le toma a una persona. En el caso particular del método de detección de texturas, mientras los grupos de imágenes sean similares entre sí en términos del brillo y las gamas de colores que tengan, los resultados de las mediciones de áreas de las heridas serán efectivos y replicables, en donde esta última característica es un aspecto esencial en el proceso de hacer ciencia a nivel mundial.Item Clasificación de Parentesco en 1° grado a partir de patrones de llamadas(Universidad del Desarrollo. Facultad de Ingeniería, 2021-07) Pérez Torres, José Alfredo; Bravo, LoretoLas empresas de telecomunicaciones utilizan la información de uso de su infraestructura para poder mejorar sus servicios y captar nuevos clientes. Uno de los desafíos que tienen es identificar las relaciones familiares entre los distintos dispositivos de su red. En la literatura existen algoritmos que nos permiten, a partir del patrón de llamadas y sus metadatos (apellidos anonimizados, género y edad), determinar si es que existen relaciones de padre, madre, hermanos. Una de las limitaciones de esta técnica, es que requiere tener los metadatos para ambos dispositivos. Este no es siempre el caso. Por ejemplo, no se cuentan con los metadatos en los siguientes casos: (1) Teléfono de otra compañía, (2) Cuando un cliente tiene múltiples teléfonos, no se sabe qué familiar/amigo utiliza el teléfono. Es por esto, que la pregunta de investigación de este proyecto es ¿Es posible implementar un modelo de machine learning capaz de identificar la relación familiar entre dos dispositivos cuando se tienen los metadatos de solo uno de los clientes? Para poder contestar nuestra pregunta, se dispone de un dataset de llamadas de telefonía móvil anonimizadas del año 2015, de la operadora Movistar junto con metadatos asociados a los dispositivos (apellidos anonimizados, género y edad). Estas llamadas de telefonía móvil corresponden a comunicaciones realizadas exclusivamente entre clientes de Movistar para los que se tienen metadatos (de hecho excluye números que están en un plan pero que no se sabe quién es el usuario del teléfono). Para poder contestar la pregunta de investigación, se utilizó la técnica de David-Barret y otros al para obtener las relaciones padre-hija, padre-hijo, madre-hija, madre-hijo utilizando los patrones de comunicación con los metadatos para ambos móviles. Luego, se entrenaron diversos modelos considerando distintos niveles de disponibilidad de metadatos para los dos dispositivos. Si bien es cierto el rendimiento de los modelos de clasificación mejora a medida que se incorporan más metadatos, no se puede considerar que se tiene buenos resultados. En consecuencia, dado el set de datos usados, no es suficiente usar como base los patrones de llamadas para la construcción y entrenamiento de modelos de clasificación para conocer la relación de parentesco en 1er grado Madre o Padre.Item Clasificación de texto con técnicas de Procesamiento del Lenguaje Natural y Machine Learning para analizar la relación entre noticias publicadas en la web y la variación de los índices de la bolsa de comercio en Chile(Universidad del Desarrollo. Facultad de Ingeniería, 2022-12) Alarcón Becerra, Adrián Enrique; Raveau, María Paz; Candia Vallejos, CristiánItem Clasificación y Predicción de Enfermedades Cardiovasculares en Adultos utilizando Métodos de Aprendizaje Automático(Universidad del Desarrollo. Facultad de Ingeniería, 2022-01) Eduardo, Inostroza Wachtendorff; Opitz, DanielaLas enfermedades cardiovasculares (ECV) constituyen la principal causa de muerte entre las enfermedades no transmisibles a nivel mundial, y la tendencia del número de afectados es al alza. Los factores de riesgos son múltiples, van desde la predisposición genética, las condiciones del medio ambiente y el lugar de residencia de las personas, hasta sus comportamientos, edad y sexo. Existe evidencia de que estas patologías pueden disminuir si se atienden a tiempo los factores de riesgo, y aquí es donde los métodos de aprendizaje automático adquieren relevancia desde un enfoque preventivo. Esta investigación analiza seis modelos predictivos basados en aprendizaje supervisado, para diagnosticar la presencia de ECV en pacientes. El conjunto datos que vamos a utilizar, corresponde a diversas características pertenecientes a pacientes de la Clínica Cleveland en Ohio. Como conclusión, el modelo de Regresión Logística fue el óptimo, cuyo alto desempeño se manifestó con 91,2% accuracy y un recall del 88%. Se encontró que el sexo del paciente y el dolor de pecho bajo un ejercicio inducido son factores de riesgo que aumentan la probabilidad de que un paciente padezca una ECV