EnglishSpanish
Secuenciación masiva de genoma humano
Nombre organización: Health In Code, S.L.
Otras organizaciones participantes

CESGA.

Sitio web otros participantes
Fuente de financiación:

Interreg – POCTEP.

Tipo de problema / sector: TIC.

Aplicación: Cloud.

Empresa:

Health In Code es una pyme española de base tecnológica con sede en A Coruña que tiene como objetivo la identificación de problemas de salud mediante el diagnóstico genético.

Reto:

La firma pretendía realizar con rapidez y seguridad el procesamiento de datos en procedimientos de secuenciación masiva de genoma humano. A partir de ficheros obtenidos de secuenciadores genéticos de Illumina, se procesaron datos con diferentes programas, aplicaciones con licencia libre, desarrollos propios de la compañía y software comercial para obtener unos ficheros de variantes genéticas con los que poder aportar información sobre cada paciente. Las pruebas y validaciones buscaban la mejora en tiempo y calidad del flujo de información para analizar.

Solución:

Después de obtenidos los datos de diferentes carreras de secuenciadores genéticos de última generación, siempre con la misma preparación de muestras -casi 60-, se adaptaron los datos para su procesamiento en los sistemas de supercomputación del CESGA, lo que permitió acelerar todo el proceso en comparación con el uso de ordenadores convencionales de escritorio.

Beneficio:

La empresa obtuvo conclusiones interesantes en cuanto a la calidad de los resultados obtenidos de los secuenciadores -falsos positivos y negativos- y en relación con el tiempo de alineamiento de las secuencias contra el genoma de referencia. Así, se consiguieron datos sobre los tiempos de cómputo, la calidad de los resultados y los parámetros más adecuados en los diferentes programas usados en el flujo de información, para la obtención de los mejores resultados en cuanto a calidad y tiempo de cómputo. Además se lograron estadísticas de calidad y cobertura de los datos, lo que mejorará el trabajo y procesado de datos de la compañía, optimizando muchos parámetros de configuración de los programas para trabajar con tipologías de datos de diferentes equipos y con calidades diferentes.

Compartir: