3. Procesado y ensamblado de secuencias genómicas
Breve introducción al sistema operativo Linux
Una introducción a los ensambladores
Programas y servicios gratuitos que permiten el procesado, ensamblaje y alineación de secuencias
Utilidades generales
- SAMtools (*****), una serie de programas diseñados para manipular los archivos proporcionados por los sistemas NGS. Convierte archivos SAM<->BAM, crea índices, ordena secuencias, crea archivos VCF (con variantes), muestra las secuencias alineadas con los SNP, bases modificadas, etc
- FastQC, programas para el control de calidad de las secuencias obtenidas con el secuenciador
- NextSeq Sequence Workbench
- FastX_Toolkit. Un montón de utilidades entre las que se incluyen la de filtrado de secuencias por calidad
- Skewer, un nuevo programa para el trimming de secuencias simples y pareadas
- Trimmomatic, un programa para el filtrado de secuencias automático especializado en datos de Illumina
Ensambladores de novo (construyen un genoma desde el principio)
- El ensamblador Velvet (usa secuencias cortas y las gráficas de Bruijn)
- El ensamblador SPAdes, para PEQUEÑOS GENOMAS que representa una mejora sobre Velvet (**) ya que usa secuencias de Illumina y PacBio, y secuencias paired-end, mate paired e incluso otros contigs como referencias
- El algoritmo QUAST que valora la calidad de los ensamblajes genómicos
- El ensamblador de Illumina Pandaseq
- El ensamblador SOAPdenovo (usa Bruijn graphs pero con corrección)
- SSAKE – Assembly of short reads, Rene Warren, et al, British Columbia Cancer Agency
- Euler – Genomic Assembly, Pavel Pevzner and Mark Chaisson, University of California, San Diego
- El ensamblador de novo ABySS (útil para genoma humano)
- El ensamblador Mira. No utiliza gráficos de Bruijn, pero permite usar secuencias con varios tipos de secuencias a la vez, como el 454, Illumina, etc.
Programas que alinean secuencias usando genomas de referencia
(útil para re-secuenciación, análisis de datos (SNP), RNA-Seq, etc)
Programas para visionar los ensamblados y los "mapeos". Permiten ver las secuencias alineadas a los genomas de referencia
Programas análisis secuencias y Anotaciones (con la finalidad de determinar variantes)
- Servicios que permiten el análisis bioinformático integrados y/o la presentación de datos
NGS
- Otros programas de interés
- Quast, un programa que analiza la calidad de los ensamblados genómicos
- GenomeTools para ver representados tus genes
- JBrowser, para ver representado los genes en una página WEB
- BSMAP que puede usarse para ver las secuencias metiladas (acceso a publicación)
|