Browsing by Author "Ferres, Leo"
Now showing 1 - 20 of 29
Results Per Page
Sort Options
Publication A dataset to assess mobility changes in Chile following local quarantines(2023) Pappalardo, Luca; Cornacchia, Giuliano; Navarro, Victor; Bravo, Loreto; Ferres, LeoFighting the COVID-19 pandemic, most countries have implemented non-pharmaceutical interventions like wearing masks, physical distancing, lockdown, and travel restrictions. Because of their economic and logistical effects, tracking mobility changes during quarantines is crucial in assessing their efficacy and predicting the virus spread. Unlike many other heavily affected countries, Chile implemented quarantines at a more localized level, shutting down small administrative zones, rather than the whole country or large regions. Given the non-obvious effects of these localized quarantines, tracking mobility becomes even more critical in Chile. To assess the impact on human mobility of the localized quarantines, we analyze a mobile phone dataset made available by Telefónica Chile, which comprises 31 billion eXtended Detail Records and 5.4 million users covering the period February 26th to September 20th, 2020. From these records, we derive three epidemiologically relevant metrics describing the mobility within and between comunas. The datasets made available may be useful to understand the effect of localized quarantines in containing the COVID-19 pandemic.Item Análisis comparativo sobre indicadores de movilidad para la zona central de Chile durante la pandemia: Exploración de diferencias entre grupos socioeconómicos y propuesta de modelo predictivo (SVR) para el índice de movilidad interno(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Fuentes Navarro, Ignacio; Orellana Montecino, David; Ferres, LeoLa presente investigación intenta aportar al entendimiento de la inercia de movilidad de la población, especialmente ante situaciones de alta complejidad como lo fue la pandemia de COVID – 19 y las medidas no farmacológicas que se aplicaron en Chile para restringir el libre desplazamiento. Para este análisis, se utilizaron datos detallados de los Índices de Movilidad (IM) construidos por Instituto Data Science de la UDD, y facilitados al Ministerio de Ciencia, los cuales se encuentran desglosados en índices internos (referentes a viajes dentro de la comuna) e índices externos (considerando desplazamientos entre comunas), así como la sumatoria de ambos como un indicador de movilidad total (IM). Uno de los resultados más significativos de esta investigación es la correlación negativa entre el índice de Movilidad interno y los niveles socioeconómicos de las comunas. Este hallazgo sugiere que factores como el ingreso y la situación económica local desempeñan un papel crucial en la configuración de los patrones de movilidad. Esta comprensión pudiese ser fundamental a la hora de diseñar estrategias de manejo de la movilidad que sean efectivas, equitativas y sensibles a las disparidades socioeconómicas. También, se desarrolla un modelo predictivo utilizando Regresión de Vectores de Soporte (SVR), que pretende ser una herramienta eficaz para predecir el índice de movilidad interno (IM_interno). El modelo se entrena con datos de comunas en la zona central de Chile, utilizando variables clave como la densidad poblacional (población/superficie en Km2) y el porcentaje de pobreza. El modelo destaca la importancia de considerar estas variables en la formulación de políticas de gestión de la movilidad. En conclusión, este estudio intenta ofrecer una visión más completa y contextualizada de la movilidad durante los tiempos de cuarentena, integrando datos cuantitativos y comprensión cualitativa de los factores subyacentes, especialmente el porcentaje de población en situación de pobreza.Item Deserción Académica y Uso de Sistemas LMS durante la Pandemia COVID-19(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Rojas Tejo, Matías; Ferres, Leo; Bravo, LoretoEste trabajo presenta un estudio de datos para determinar la relación existente entre la actividad de los alumnos de la Facultad de Ingeniería de la Universidad del Desarrollo en el Learning Management System Canvas y la deserción académica de ellos. El objetivo de esta investigación es encontrar variables estadísticamente significativas que determinan la deserción académica según la actividad de los alumnos en Canvas. Para lograrlo se propone un análisis de datos, generados por el LMS utilizando la estadística descriptiva, y regresiones lineales y logísticas. Los datos muestran que la deserción académica se puede analizar a través de una regresión logística cuya exactitud es 70,86% y precisión del 70 %, con posibilidad de mejorar su rendimiento, utilizando variables de caracterización personal de la población de estudiantes, con una exactitud de 71,58% y una precisión del 72,36 %. En síntesis, las variables del LMS que generan advertencia respecto a la decisión de un alumno que no continuará estudiando son cantidad de clics en tests, foros de discusión, tareas, cursos y mensajes enviados, además de la cantidad de conexiones a Zoom por el estudiante. Las variables mencionadas no tienen relación lineal significativa con la deserción académica, pero las encontradas son las variables independientes de la regresión logística que logran generar una alerta sobre el comportamiento del alumno.Item Efectos de la Movilidad Interregional en la Propagación de Casos De Covid-19 en Chile(Universidad del Desarrollo. Facultad de Ingeniería, 2022-01) Marín César; Berríos Jesús; Ferres, LeoLa pandemia provocada por el virus SARS-CoV-2 ha llevado a que todos los países implementen medidas que reduzcan la movilidad internacional y doméstica para así evitar el crecimiento acelerado de casos de COVID-19. Debido a los altos costos sociales y económicos de estas restricciones las autoridades chilenas han impulsado una serie de medidas dinámicas, las cuales han estado enfocadas en zonas geográficas específicas como por ejemplo, regiones y comunas. El objetivo principal de esta investigación está referido precisamente a evaluar el efecto de estas restricciones de movilidad, en un contexto interregional. Los datos considerados durante el desarrollo de este trabajo provienen de fuentes públicas, como las cifras oficiales de coronavirus del Ministerio de Salud, y privadas, como datos de registros telefónicos de tipo eXtended Detail Records. Los resultados obtenidos reflejan la importancia de considerar la proporción de muertes por caso confirmado (CFR) de cada región debido a la demografía heterogénea de ellas. Además, las estimaciones de asertividad, que corresponden a la proporción de casos sintomáticos efectivamente reportados, muestran que en la mayoría de las regiones se tiene un comportamiento creciente conforme avanzan los primeros meses de la pandemia con excepción de la Región Metropolitana la cual no muestra una mejoría clara para esta métrica. Por otro lado, los datos de telefonía permitieron dimensionar los cambios de movilidad en escenarios de pre-pandemia, restricciones parciales y cuarentena total para luego poder estimar la cantidad de casos importados y finalmente estimar el índice de riesgo por cada región destino. Se encontró que, de acuerdo a esta métrica y al ritmo reproductivo básico Rt, las medidas de restricción en la movilidad interregional para los escenarios estudiados tuvieron un efecto sustancial en la mayoría de las regiones con datos disponibles.Item Este político no existe: usando GPT-2 para la generación de tweets políticos(Universidad del Desarrollo. Facultad de Ingeniería, 2020-12) Rodríguez Garrido, Enrique; Ferres, LeoLos modelos de lenguaje natural han adquirido una importante relevancia desde 2018 cuando se incorpora de la arquitectura Transformer. Aunque existe una gran cantidad y muy diversos trabajos al respecto, muy poco podemos encontrar en español. Este trabajo aborda una aplicación del modelo GPT-2, una implementación de arquitectura transformer en un modelo de lenguaje, para ejecutar tareas de generación de texto casual y texto controlado. En ambos casos hemos realizado el entrenamiento con las publicaciones más recientes de las autoridades políticas chilenas en la red social twitter. Los resultados muestran que incluso un modelo GPT-2 base puede ser ajustado para cumplir una tarea específica como generar nuevos Tweets políticos reutilizando el aprendizaje del lenguaje pre entrenado. Además entrenamos el modelo para que aprenda de los contextos de cada uno de los tweets y utilizar estos mismos contextos para solicitar la generación de acuerdo a parámetros de control. Las aplicaciones de estos nuevos modelos de lenguaje con atención están en la vida personal como en el mundo empresarial. Usando estas innovaciones es posible agregar más valor a servicios actuales o crear nuevos servicios, habilitados con esta tecnologíaItem Estimating the effect of social inequalities on the mitigation of COVID-19 across communities in Santiago de Chile(2021) Gozzi, Nicolò; Tizzoni, Michele; Chinazzi, Matteo; Vespignani, Alessandro; Perra, Nicola; Ferres, LeoWe study the spatio-temporal spread of SARS-CoV-2 in Santiago de Chile using anonymized mobile phone data from 1.4 million users, 22% of the whole population in the area, characterizing the effects of non-pharmaceutical interventions (NPIs) on the epidemic dynamics. We integrate these data into a mechanistic epidemic model calibrated on surveillance data. As of August 1, 2020, we estimate a detection rate of 102 cases per 1000 infections (90% CI: [95–112 per 1000]). We show that the introduction of a full lockdown on May 15, 2020, while causing a modest additional decrease in mobility and contacts with respect to previous NPIs, was decisive in bringing the epidemic under control, highlighting the importance of a timely governmental response to COVID-19 outbreaks. We find that the impact of NPIs on individuals’ mobility correlates with the Human Development Index of comunas in the city. Indeed, more developed and wealthier areas became more isolated after government interventions and experienced a significantly lower burden of the pandemic. The heterogeneity of COVID-19 impact raises important issues in the implementation of NPIs and highlights the challenges that communities affected by systemic health and social inequalities face adapting their behaviors during an epidemic.Item Estudio de la relación entre casos policiales y personas en horario hábil en las comunas de Chile(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Nilo Durán, Salomón Dennis; Bravo, Loreto; Ferres, LeoSegún el Banco Mundial (Ayres, 1998) la delincuencia tiene un impacto negativo para un buen clima de inversión, contribuyen a la reducción de la inversión en infraestructura y otros. Asimismo, el crimen tiene un impacto muy negativo para los gobiernos, pues produce que deban invertir en programas costosos contra la delincuencia, empujando a que la ciudadanía invierta en seguridad privada, haciendo que la imagen del gobierno se vea mermada. Es de preocupación colectiva el combate contra la delincuencia para un estado de bienestar común, este proyecto nos ayuda a entender cómo se comporta la delincuencia a lo largo de Chile. Usaremos datos de dispositivos móviles y su geolocalización en cada comuna los cuales compararemos contra la cantidad de casos policiales ocurridos en cada unidad geográfica. Este análisis se hizo con datos de los años 2020, 2021 y 2022. El proyecto concluyó que sí existe una relación directa entre cantidad de crímenes y cantidad de personas y también cómo es dicha relación, así poder realizar distintos análisis comunales y construir semáforos de tendencia al alza o baja de delitos.Item Evaluation of home detection algorithms on mobile phone data using individual-level ground truth(2021) Pappalardo, Luca; Ferres, Leo; Sacasa, Manuel; Cattuto, Ciro; Bravo, LoretoInferring mobile phone users’ home location, i.e., assigning a location in space to a user based on data generated by the mobile phone network, is a central task in leveraging mobile phone data to study social and urban phenomena. Despite its widespread use, home detection relies on assumptions that are difficult to check without ground truth, i.e., where the individual who owns the device resides. In this paper, we present a dataset that comprises the mobile phone activity of sixty-five participants for whom the geographical coordinates of their residence location are known. The mobile phone activity refers to Call Detail Records (CDRs), eXtended Detail Records (XDRs), and Control Plane Records (CPRs), which vary in their temporal granularity and differ in the data generation mechanism. We provide an unprecedented evaluation of the accuracy of home detection algorithms and quantify the amount of data needed for each stream to carry out successful home detection for each stream. Our work is useful for researchers and practitioners to minimize data requests and maximize the accuracy of the home antenna location.Item Evitemos el castigo, Modelo de predicción de operaciones de crédito con posible default financiero(Universidad del Desarrollo. Facultad de Ingeniería, 2020-12) Eulufi Malbrán, Cristóbal; Ferres, LeoLas empresas del rubro financiero obtienen sus ingresos en base a los intereses percibidos de los créditos otorgados a sus clientes, por consiguiente, cuando un cliente no cancela las cuotas de su crédito, la institución asume la pérdida del capital prestado (castigo), impactando negativamente en sus utilidades. Coopeuch, institución financiera cooperativa, minimiza el riesgo de castigo de los créditos mediante la modalidad de descuento por planilla, sin embargo, a pesar de esta metodología, tiene pérdidas generadas por el no pago de los créditos equivalente al 30% de su margen financiero, lo cual afecta en el remanente entregado a sus socios. El objetivo de este paper es comparar modelos de marchine learning y ver cuál de ellos predice de mejor manera que operación de crédito se castigará para generar estrategias de cobranza y reducir las pérdidas por no pago. Se estudiaron tres modelos puntuales, regresión logística, random forest y extreme gradiente boosting (XGBoost), modelos más utilizados en estudios similares realizados por otros autores, donde se pensaba que el modelo XGBoost tendría mejor performance mediante el algoritmo de descenso de gradiente. El modelo que mejor resultado entrega al estudio fue Random Forest, con un accuracy de 95% y un ROC-AUC de 98,9%.Item Fast and Compact Planar Embeddings(2017) Ferres, Leo; Fuentes-Sepúlveda, José; Gagie, Travis; He, MengThere are many representations of planar graphs, but few are as elegant as Turan's (1984): it is simple and practical, uses only 4 bits per edge, can handle self-loops and multiedges, and can store any specified embedding. Its main disadvantage has been that "it does not allow efficient searching" (Jacobson, 1989). In this paper we show how to add a sublinear number of bits to Turan's representation such that it supports fast navigation while retaining simplicity. As a consequence of the inherited simplicity, we offer the first efficient parallel construction of a compact encoding of a planar graph embedding. Our experimental results show that the resulting representation uses about 6 bits per edge in practice, supports basic navigation operations within a few microseconds, and can be built sequentially at a rate below 1 microsecond per edge, featuring a linear speedup with a parallel efficiency around 50% for large datasets. (C) 2020 Elsevier B.V. All rights reservedItem Fast and compact planar embeddings(2020) Ferres, Leo; Fuentes-Sepúlveda, José; Gagie, Travis; He, Meng; Navarro, GonzaloThere are many representations of planar graphs, but few are as elegant as Turán’s (1984): it is simple and practical, uses only 4 bits per edge, can handle self-loops and multiedges, and can store any specified embedding. Its main disadvantage has been that “it does not allow efficient searching” (Jacobson, 1989). In this paper we show how to add a sublinear number of bits to Turán’s representation such that it supports fast navigation while retaining simplicity. As a consequence of the inherited simplicity, we offer the first efficient parallel construction of a compact encoding of a planar graph embedding. Our experimental results show that the resulting representation uses about 6 bits per edge in practice, supports basic navigation operations within a few microseconds, and can be built sequentially at a rate below 1 microsecond per edge, featuring a linear speedup with a parallel efficiency around 50% for large datasets.Item Fast and Compact Planar Embeddings(2019) Ferres, Leo; Fuentes-Sepúlveda, José; Gagie, Travis; He, Meng; Navarro, GonzaloThere are many representations of planar graphs, but few are as elegant as Turán’s (1984): it is simple and practical, uses only 4 bits per edge, can handle self-loops and multi-edges, and can store any specified embedding. Its main disadvantage has been that “it does not allow efficient searching” (Jacobson, 1989). In this paper we show how to add a sublinear number of bits to Turán’s representation such that it supports fast navigation while retaining simplicity. As a consequence of the inherited simplicity, we offer the first efficient parallel construction of a compact encoding of a planar graph embedding. Our experimental results show that the resulting representation uses about 6 bits per edge in practice, supports basic navigation operations within a few microseconds, and can be built sequentially at a rate below 1 microsecond per edge, featuring a linear speedup with a parallel efficiency around 50% for large datasets.Item Home location detection algorithm comparison using mobile phone data vs real users ground truth(Universidad del Desarrollo. Facultad de Ingeniería, 2020-08) Sacasa Ares, Manuel Antonio; Ferres, LeoThe detection of Home location is one of the main profiling attributes for telcos, real estate, banking, advertising and targeting companies. Literature shows many examples of criteria, heuristics and algorithms trying to solve the problem. In this document, the objective is to select a final criteria and data source comparing: 5 algorithm, a 2-week data set of three mobile data sources (CDRs-XDRs-Control Plane) and a 75-inhabitants real address data set, built with a survey method, as a ground truth test data set. This lead us to understand: - The behavior of the data source: users hit frequency and the impact on algorithm results, method of processing home antenna ranking one, human dependency day-night source behavior and home antenna precision, hit recording logic, noise, error and their limits to solve home location. - The possible solutions: type of criteria, Geo-time heuristics, counting algorithm types (one or two-step), performance and precision of each algorithm linked to each source. - The metrics: Test correlation between the closest tower in Euclidean distance versus home tower (output of each algorithm), bias result from 3G data vs. 4g(Lte) antennas, measured Euclidean distance as error between real declared address coordinates and home tower when it’s the closest tower or not. The first step of the document takes the recommendations and implementation of HDAs (Home detection algorithms) and criteria [1][3][5][6][14][16] to compare the difference and behavior between sources and criteria applied to each algorithm (Ranking antenna’s hits, ranking antenna’s frequency, ranking with time filter, ranking with geographical filter and mix geo-time filters). The second step is to design metrics in order to compare the pair of best performers algorithm with their source: binary metric for a match between HDA result and home antenna ranking, valued match between ranking 1-2-3 home antenna, absolute error distance and MSE distance to real address. The final step is to test an experimental new approach, applying a circadian sleep cycle for each user, to detect time range and process an individual time-range home antenna as a solution for the gaps detected in the first two steps. Comparing circadian results versus the best HDA method, source and groundtruth.Publication Linking physical violence to women’s mobility in Chile(2023) Contreras, Hugo; Candia Vallejos, Cristian; Troncoso, Rodrigo; Ferres, Leo; Bravo, Loreto; Rodriguez-Sickert, CarlosDespite increased global attention on violence against women, understanding the factors that lead to women becoming victims remains a critical challenge. Notably, the impact of domestic violence on women’s mobility—a critical determinant of their social and economic independence—has remained largely unexplored. This study bridges this gap, employing police records to quantify physical and psychological domestic violence, while leveraging mobile phone data to proxy women’s mobility. Our analyses reveal a negative correlation between physical violence and female mobility, an association that withstands robustness checks, including controls for economic independence variables like education, employment, and occupational segregation, bootstrapping of the data set, and applying a generalized propensity score matching identification strategy. The study emphasizes the potential causal role of physical violence on decreased female mobility, asserting the value of interdisciplinary research in exploring such multifaceted social phenomena to open avenues for preventive measures. The implications of this research extend into the realm of public policy and intervention development, offering new strategies to combat and ultimately eradicate domestic violence against women, thereby contributing to wider efforts toward gender equity.Item Migración interna por región: para años desde el 2020,2021 y 2022(Universidad del Desarrollo. Facultad de Ingeniería, 2023) Wilson Yraola, Jorge Francisco; Bravo, Loreto; Ferres, LeoEl presente documento señala bajo la información que brinda los datos provenientes de registros de detalles extendidos (XDR) correspondientes a una mezcla de activación por el usuario y del dispositivo, el traslado de dispositivos por Chile en los años 2020, 2021 y 2022. Con ello, se realiza el análisis bajo el traslado dentro de un mes entre regiones, considerando la inmigración y emigración de una región. Para ello se utiliza el trabajo con Python y un servidor para el trabajo con grandes volúmenes de datos de la Universidad del desarrollo y también de la optimización constante del código para poder procesar y lograr el análisis. La motivación de este estudio concierne a las distintas modalidades que han ocurrido debido a la pandemia, que causa y brindo el potencial de la remotización de variados trabajos y una eventual dispersión de personas de Santiago a regiones, la cual se busca confirmar con los datos anteriormente indicados.Item Modelo Emprendedor. Basado en Información Tributaria(2021-12) Jara Aburto, Juan Francisco; Ferres, LeoEste trabajo busca entender si es posible identificar a aquellas empresas productivas que pueden llegar a convertirse en PyME (pequeñas y medianas empresas van desde 2.400 UF hasta 100.000 UF de venta anual) basándose en información tributaria disponible en Servicio de Impuestos Internos. Esta información es útil para segmentar clientes empresas y ofrecerles desde un inicio una oferta de productos apropiada para apoyar el crecimiento, por ejemplo, desde la industria bancaria. La segmentación de una microempresa con potencial de convertirse en PyME y de una microempresa destinada a seguir como tal, es inherentemente distinta, tanto como en oferta de valor, modelo de atención, riesgo de default esperado en caso de otorgarles un crédito, etc. Poder identificarlas con antelación puede suponer una ventaja competitiva importante para una empresa B2B. El mejor resultado obtenido fue mediante XGBoost preprocesando la data categórica con WoE Encoding y calibrando hiperparámetros con el algoritmo Subplex. Se obtuvo un AUC PR de un 45,43% en un set de test. Los resultados de estas predicciones fueron analizados mediante SHAP Values, donde la Actividad Económica de la empresa es la que más incide en la variabilidad final de la decisión del modelo. El modelo seleccionado posee un ECE de un 0,59%, lo cual indica que las probabilidades obtenidas se encuentran bien calibradas y pueden ser utilizadas para estimar utilidades esperadas.Item Movilidad a través de la red de Metro de Santiago en tiempos de pandemia(Universidad del Desarrollo. Facultad de Ingeniería, 2021-06) Faúndez Quezada, Andrea; Ferres, LeoLa enfermedad viral COVID-19 fue declarada como pandemia por la Organización Mundial (OMS) de la Salud el 11 de marzo de 2020, y ha recomendado diversas medidas a la población mundial y a los Gobiernos para frenar la propagación, dentro de las que se encuentra el distanciamiento social. En el caso de Chile se ha alternado entre cuarentenas dinámicas y totales, a fin de disminuir las interacciones en las comunas con mayor tasa de incidencia y evitar el desplazamiento desde, hacia y dentro de estas comunas. El presente estudio tiene por objetivo relacionar la movilidad en Metro y el aumento de contagios en las comunas de la Región Metropolitana a través de la centralidad de la red, para lo cual se utilizó el tráfico de datos entre dispositivos móviles y antenas que cubren la red de Metro de Santiago, y datos de contagios de COVID-19 semanales por comuna, en el periodo desde el 02 de marzo de 2020 hasta el 05 de julio del mismo año. Se construyeron redes direccionadas y ponderadas por la cantidad de viajes en Metro entre comunas, obteniendo como resultado que el betweenness centrality y la cantidad de casos nuevos de COVID-19 presentan una correlación positiva promedio de 0,1251 considerando 4 semanas de desfase entre los viajes y el aumento de casos. Las correlaciones más altas se obtuvieron para las comunas de La Reina, La Florida y Las Condes, con un coeficiente de correlación de Pearson promedio de 0,3421 para los distintos desfases considerados (1, 2, 3 y 4 semanas). Además, se obtuvo que la comuna de Santiago es la que posee mayor centralidad de intermediación en periodos sin restricciones y también durante cuarentenas, aun cuando la movilidad en Metro cayó un 80% aproximadamente.Item News and the city: understanding online press consumption patterns through mobile data(2020) Vilella, Salvatore; Paolotti, Daniela; Ruffo, Giancarlo; Ferres, LeoThe always increasing mobile connectivity affects every aspect of our daily lives, including how and when we keep ourselves informed and consult news media. By studying a DPI (deep packet inspection) dataset, provided by one of the major Chilean telecommunication companies, we investigate how different cohorts of the population of Santiago De Chile consume news media content through their smartphones. We find that some socio-demographic attributes are highly associated to specific news media consumption patterns. In particular, education and age play a significant role in shaping the consumers behaviour even in the digital context, in agreement with a large body of literature on off-line media distribution channels.Item On the nature of real and perceived bias in the mainstream media(2018) Elejalde, Erick; Ferres, Leo; Herder, EelcoNews consumers expect news outlets to be objective and balanced in their reports of events and opinions. However, there is a growing body of evidence of bias in the media caused by underlying political and socio-economic viewpoints. Previous studies have tried to classify the partiality of the media, but there is little work on quantifying it, and less still on the nature of this partiality. The vast amount of content published in social media enables us to quantify the inclination of the press to pre-defined sides of the socio-political spectrum. To describe such tendencies, we use tweets to automatically compute a news outlet’s political and socio-economic orientation. Results show that the media have a measurable bias, and illustrate this by showing the favoritism of Chilean media for the ruling political parties in the country. This favoritism becomes clearer as we empirically observe a shift in the position of the mass media when there is a change in government. Even though relative differences in bias between news outlets can be observed, public awareness of the bias of the media landscape as a whole appears to be limited by the political space defined by the news that we receive as a population. We found that the nature of the bias is reflected in the vocabulary used and the entities mentioned by different news outlets. A survey conducted among news consumers confirms that media bias has an impact on the coverage of controversial topics and that this is perceivable by the general audience. Having a more accurate method to measure and characterize media bias will help readers position outlets in the socio-economic landscape, even when a (sometimes opposite) self-declared position is stated. This will empower readers to better reflect on the content provided by their news outlets of choice.Item Parallel construction of succinct trees(2017) Fuentes-Sepúlveda, José; Ferres, Leo; He, Meng; Zeh, NorbertSuccinct representations of trees are an elegant solution to make large trees fit in main memory while still supporting navigational operations in constant time. However, their construction time remains a bottleneck. We introduce two parallel algorithms that improve the state of the art in succinct tree construction. Our results are presented in terms of work, the time needed to execute a parallel computation using one thread, and span, the minimum amount of time needed to execute a parallel computation, for any amount of threads. Given a tree on n nodes stored as a sequence of balanced parentheses, our first algorithm builds a succinct tree representation with O(n) work, O(lgn) span and supports a rich set of operations in O(lgn) time. Our second algorithm improves the query support. It constructs a succinct representation that supports queries in O(c) time, taking O(n+nlgcnlg(nlgcn)+cc) work and O(c+lg(ncclgcn)) span, for any positive constant c. Both algorithms use O(nlgn) bits of working space. In experiments using up to 64 cores on inputs of different sizes, our first algorithm achieved good parallel speed-up. We also present an algorithm that takes O(n) work and O(lgn) span to construct the balanced parenthesis sequence of the input tree required by our succinct tree construction algorithm.