Project Description
Health In Code, S.L.: Secuenciación masiva del genoma humano
Pyme
Health In Code es una PYME española de base tecnológica con sede en A Coruña que tiene como objetivo la identificación de problemas de salud mediante el diagnóstico genético.
Retos
La firma pretendía realizar con rapidez y seguridad el procesamiento de datos en procedimientos de secuenciación masiva de genoma humano. A partir de ficheros obtenidos de secuenciadores genéticos de Illumina, se procesaron datos con diferentes programas, aplicaciones con licencia libre, desarrollos propios de la compañía y software comercial para obtener unos fi cheros de variantes genéticas con los que poder aportar información sobre cada paciente. Las pruebas y validaciones buscaban la mejora en tiempo y calidad del flujo de información para analizar.
Soluciones
Después de obtenidos los datos de diferentes carreras de secuenciadores genéticos de última generación, siempre con la misma preparación de muestras -casi 60-, se adaptaron los datos para su procesamiento en los sistemas de supercomputación del CESGA, lo que permitió acelerar todo el proceso en comparación con el uso de ordenadores convencionales de escritorio.
Beneficios
La empresa obtuvo conclusiones interesantes en cuanto a la calidad de los resultados obtenidos de los secuenciadores -falsos positivos y negativos- y en relación con el tiempo de alineamiento de las secuencias contra el genoma de referencia. Así, se consiguieron datos sobre los tiempos de cómputo, la calidad de los resultados y los parámetros más adecuados en los diferentes programas usados en el flujo de información, para la obtención de los mejores resultados en cuanto a calidad y tiempo de cómputo. Además se lograron estadísticas de calidad y cobertura de los datos, lo que mejorará el trabajo y procesado de datos de la compañía , optimizando muchos parámetros de configuración de los programas para trabajar con tipología s de datos de diferentes equipos y con calidades diferentes. Gracias a este proyecto se pudo realizar una optimización inicial de los flujos de datos bioinformáticos, y se definieron decenas de parámetros de procesado, al tiempo que se redujeron los tiempos de cómputo, consiguiendo un ahorro de costes por el menor uso de las infraestructuras, y un menor tiempo de respuesta a clientes.
Organizaciones participantes
Health In Code, S.L. www.healthincode.com
CESGA, www.cesga.es
Financiación: Interreg – POCTEP