VARIANT FINDER: Un procesador de datos genéticos para usuarios no expertos
Date
2023
Type:
Thesis
item.page.extent
22 p.
item.page.accessRights
Acceso abierto
item.contributor.advisor
ORCID:
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad del Desarrollo. Facultad de Ingeniería
item.page.isbn
item.page.issn
item.page.issne
item.page.doiurl
item.page.other
item.page.references
Abstract
La generación de datos genómicos ha aumentado exponencialmente y, lejos de mostrar signos de estancarse, cada vez los costos son menores y las aplicaciones de genómica, transcriptómica, epigenómica y otras basadas en HTS aumentan1. Sin ir más allá, al año 2016 el repositorio de datos genómicos más grande del mundo (SRA) tenía datos almacenados por 4x1015 bytes2 y su tamaño actual se estima en 2,3x1016 bytes3.
Por tanto, la capacidad de cómputo que se ha tenido que implementar para un correcto manejo y análisis de los datos generados es también, significativa. Así mismo, la bioinformática pasó de ser una herramienta a ser una disciplina de estudio en sí misma2,4.
Este trabajo es una aproximación para generar una herramienta diseñada para facilitar el uso e interpretación de datos genéticos y ponerla a disposición de colegas investigadores no expertos en manejo de datos genéticos. La propuesta busca que los datos sean usados de una manera eficiente y dinámica sin necesidad de implementar códigos de programación para los que el/la investigadora pueden ser ajenos y no ser objetivo central de la investigación para la que los datos genéticos fueron generados.
En este sentido, la propuesta muestra un prototipo de interfaz web en la que el usuario ingresará un archivo de variantes genéticas (Variant Call File o *.vcf) e ingresará palabras clave para que el código implementado en el backend haga una búsqueda en Pubmed. A partir de esta búsqueda, el código implementado obtendrá los genes mencionados en los resúmenes de los trabajos indexados en Pubmed y filtrará el archivo de variantes (vcf) para mostrarle al investigador solamente las variantes presentes en genes que han sido previamente asociadas a los conceptos ingresados en la búsqueda de Pubmed.
La propuesta pretende facilitar el análisis personalizado de datos genómicos desde una perspectiva de usuario no experto. Es decir, pone a disposición una interfaz de fácil acceso (web) y con un flujo de información simple y lógico, pero que a la vez permite que el usuario final tenga una herramienta robusta de análisis de datos que, de otra manera, no podría hacer por sí solo.
Description
Proyecto de grado presentado a la Facultad de Ingeniería de la Universidad del Desarrollo para optar al grado académico de Magíster en Data Science
item.page.coverage.spatial
Santiago
item.page.sponsorship
Citation
Keywords
070037S, Análisis de datos, Datos