Health In Code, S.L.: Secuenciación masiva del genoma humano 2017-03-27T13:42:26+00:00

Project Description

Health In Code, S.L.: Secuenciación masiva del genoma humano

Pyme

Health In Code es una PYME española de base tecnológica con sede en A Coruña que tiene como objetivo la identificación de problemas de salud mediante el diagnóstico genético.

Retos

La firma pretendía realizar con rapidez y seguridad el procesamiento de datos en procedimientos de secuenciación masiva de genoma humano. A partir de ficheros obtenidos de secuenciadores genéticos de Illumina, se procesaron datos con diferentes programas, aplicaciones con licencia libre, desarrollos propios de la compañía  y software comercial para obtener unos fi cheros de variantes genéticas con los que poder aportar información sobre cada paciente. Las pruebas y validaciones buscaban la mejora en tiempo y calidad del flujo de información para analizar.

Soluciones

Después  de obtenidos los datos de diferentes carreras de secuenciadores genéticos de última generación, siempre con la misma preparación  de muestras -casi 60-, se adaptaron los datos para su procesamiento en los sistemas de supercomputación del CESGA, lo que permitió acelerar todo el proceso en comparación con el uso de ordenadores convencionales de escritorio.

secuenciación genoma

Beneficios

La empresa obtuvo conclusiones interesantes en cuanto a la calidad de los resultados obtenidos de los secuenciadores -falsos positivos y negativos- y en relación  con el tiempo de alineamiento de las secuencias contra el genoma de referencia. Así, se consiguieron datos sobre los tiempos de cómputo, la calidad de los resultados y los parámetros más  adecuados en los diferentes programas usados en el flujo de información, para la obtención  de los mejores resultados en cuanto a calidad y tiempo de cómputo. Además se lograron estadísticas de calidad y cobertura de los datos, lo que mejorará el trabajo y procesado de datos de la compañía , optimizando muchos parámetros de configuración  de los programas para trabajar con tipología s de datos de diferentes equipos y con calidades diferentes. Gracias a este proyecto se pudo realizar una optimización  inicial de los flujos de datos bioinformáticos, y se definieron decenas de parámetros de procesado,  al tiempo que se redujeron los tiempos de cómputo, consiguiendo un ahorro de costes por el menor uso de las infraestructuras, y un menor tiempo de respuesta a clientes.

Organizaciones participantes

Health In Code, S.L.  www.healthincode.com

CESGA, www.cesga.es

Financiación: Interreg – POCTEP