Raveau Morales, María PazGallardo Henríquez, Vicente2026-03-182026-03-182025https://hdl.handle.net/11447/10638Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data ScienceEste proyecto analiza el discurso parlamentario chileno desde una doble dimensión temática y emocional, aplicando técnicas de procesamiento de lenguaje natural a un corpus de 1.674 sesiones del Senado chileno entre 2010 y 2025, con más de 41 millones de palabras. Para la clasificación temática se construyó un diccionario maestro en cinco ejes de política pública (economía, educación, salud, medioambiente y seguridad), iniciado desde términos semilla extraídos de literatura especializada y expandido semánticamente mediante embeddings (Word2Vec entrenado sobre el corpus y FastText preentrenados), seguido por un proceso iterativo de depuración y validación manual para reducir activaciones falsas y mejorar especificidad temática. En resultados, la clasificación aplicada al corpus completo muestra una agenda temática relativamente equilibrada con mayor presencia de economía (22,52%) y seguridad (21,33%), seguidas por salud (19,18%), educación (17,44%) y medioambiente (9,02%), mientras que “Otros” representa 10,51% de sesiones sin predominancia temática según los criterios definidos. Aplicando a las sesiones con tópico asignado (excluyendo “Otros”), el análisis de sentimiento sobre 1.498 sesiones segmentadas en 140.977 bloques muestra predominio de neutralidad (~61%), con una proporción relevante de negatividad (~32%) y un componente positivo minoritario (~7%), patrón coherente con un registro legislativo técnico y argumentativo. Finalmente, la evolución temporal indica variaciones sistemáticas del tono emocional, destacando un mínimo en 2020 y una moderación posterior, sugiriendo sensibilidad del discurso a coyunturas político-institucionales. En conjunto, el estudio confirma que el discurso parlamentario chileno presenta estructuración temática identificable mediante enfoques léxicos validados y variación emocional sistemática medible con modelos de lenguaje adecuados al dominio, aportando una metodología reproducible para caracterizar prioridades temáticas y clima discursivo a gran escala.39 p.es070037SProcesamiento de lenguaje naturalAnálisis de tópicosDiscursosAnálisis Temático y de Sentimiento del Discurso Parlamentario Chileno: un enfoque de procesamiento del lenguaje natural aplicado a sesiones del Senado (2010-2025)Thesis