Bravo, LoretoPérez Torres, José Alfredo2021-08-302021-08-302021-07http://hdl.handle.net/11447/4530Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data ScienceLas empresas de telecomunicaciones utilizan la información de uso de su infraestructura para poder mejorar sus servicios y captar nuevos clientes. Uno de los desafíos que tienen es identificar las relaciones familiares entre los distintos dispositivos de su red. En la literatura existen algoritmos que nos permiten, a partir del patrón de llamadas y sus metadatos (apellidos anonimizados, género y edad), determinar si es que existen relaciones de padre, madre, hermanos. Una de las limitaciones de esta técnica, es que requiere tener los metadatos para ambos dispositivos. Este no es siempre el caso. Por ejemplo, no se cuentan con los metadatos en los siguientes casos: (1) Teléfono de otra compañía, (2) Cuando un cliente tiene múltiples teléfonos, no se sabe qué familiar/amigo utiliza el teléfono. Es por esto, que la pregunta de investigación de este proyecto es ¿Es posible implementar un modelo de machine learning capaz de identificar la relación familiar entre dos dispositivos cuando se tienen los metadatos de solo uno de los clientes? Para poder contestar nuestra pregunta, se dispone de un dataset de llamadas de telefonía móvil anonimizadas del año 2015, de la operadora Movistar junto con metadatos asociados a los dispositivos (apellidos anonimizados, género y edad). Estas llamadas de telefonía móvil corresponden a comunicaciones realizadas exclusivamente entre clientes de Movistar para los que se tienen metadatos (de hecho excluye números que están en un plan pero que no se sabe quién es el usuario del teléfono). Para poder contestar la pregunta de investigación, se utilizó la técnica de David-Barret y otros al para obtener las relaciones padre-hija, padre-hijo, madre-hija, madre-hijo utilizando los patrones de comunicación con los metadatos para ambos móviles. Luego, se entrenaron diversos modelos considerando distintos niveles de disponibilidad de metadatos para los dos dispositivos. Si bien es cierto el rendimiento de los modelos de clasificación mejora a medida que se incorporan más metadatos, no se puede considerar que se tiene buenos resultados. En consecuencia, dado el set de datos usados, no es suficiente usar como base los patrones de llamadas para la construcción y entrenamiento de modelos de clasificación para conocer la relación de parentesco en 1er grado Madre o Padre.59 p.esLlamadas móvilesMachine learningModelos de clasificaciónPatrones de llamadasPadres e hijosParentesco070037SClasificación de Parentesco en 1° grado a partir de patrones de llamadasThesis