VARIANT FINDER: Un procesador de datos genéticos para usuarios no expertos

Date

2023

Type:

Thesis

item.page.extent

22 p.

item.page.accessRights

Acceso abierto

item.contributor.advisor

ORCID:

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad del Desarrollo. Facultad de Ingeniería

item.page.isbn

item.page.issn

item.page.issne

item.page.doiurl

item.page.other

item.page.references

Abstract

La generación de datos genómicos ha aumentado exponencialmente y, lejos de mostrar signos de estancarse, cada vez los costos son menores y las aplicaciones de genómica, transcriptómica, epigenómica y otras basadas en HTS aumentan1. Sin ir más allá, al año 2016 el repositorio de datos genómicos más grande del mundo (SRA) tenía datos almacenados por 4x1015 bytes2 y su tamaño actual se estima en 2,3x1016 bytes3. Por tanto, la capacidad de cómputo que se ha tenido que implementar para un correcto manejo y análisis de los datos generados es también, significativa. Así mismo, la bioinformática pasó de ser una herramienta a ser una disciplina de estudio en sí misma2,4. Este trabajo es una aproximación para generar una herramienta diseñada para facilitar el uso e interpretación de datos genéticos y ponerla a disposición de colegas investigadores no expertos en manejo de datos genéticos. La propuesta busca que los datos sean usados de una manera eficiente y dinámica sin necesidad de implementar códigos de programación para los que el/la investigadora pueden ser ajenos y no ser objetivo central de la investigación para la que los datos genéticos fueron generados. En este sentido, la propuesta muestra un prototipo de interfaz web en la que el usuario ingresará un archivo de variantes genéticas (Variant Call File o *.vcf) e ingresará palabras clave para que el código implementado en el backend haga una búsqueda en Pubmed. A partir de esta búsqueda, el código implementado obtendrá los genes mencionados en los resúmenes de los trabajos indexados en Pubmed y filtrará el archivo de variantes (vcf) para mostrarle al investigador solamente las variantes presentes en genes que han sido previamente asociadas a los conceptos ingresados en la búsqueda de Pubmed. La propuesta pretende facilitar el análisis personalizado de datos genómicos desde una perspectiva de usuario no experto. Es decir, pone a disposición una interfaz de fácil acceso (web) y con un flujo de información simple y lógico, pero que a la vez permite que el usuario final tenga una herramienta robusta de análisis de datos que, de otra manera, no podría hacer por sí solo.

Description

Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science

item.page.coverage.spatial

Santiago

item.page.sponsorship

Citation

Keywords

070037S, Análisis de datos, Datos

item.page.dc.rights

item.page.dc.rights.url