Tema 7. Transcriptómica
- Análisis de la expresión génica a nivel de transcrito.
- Procesado y anotación masiva de secuencias (Blast2Go).
- Análisis mediante microarrays.
- Análisis mediante RNA-Seq.
- Aproximaciones al estudio del ARN no codificante (ncRNA).
- Small RNA.
- Generación, uso y aplicaciones del miRNA.
1. Análisis de la expresión génica a nivel de transcrito
- Análisis individual de la expresión de transcrito
- Análisis SAGE (Serial Analysis of Gene Expression)
(desarrollada por el Dr. Velculescu)
2. Procesado y anotación masiva de secuencias
- EGAssembler, un servidor simple y útil para la manipulación y ensamblado de secuencias, incluyendo las librerías de EST que usa el ensamblador CAP3
- La página del programa Blast2Go para la anotación masiva de genes
3. Análisis mediante microarrays
4. Análisis mediante RNA-Seq
- Introducción al RNA-Seq
- El problema del rRNA.
- Cómo trabajar con las cadenas sentido y antisentido (info)
- Bibliotecas Stranded vs non-stranded en el RNA-seq
Programas y servicios diseñados para el análisis mediante RNA-Seq
A) Servicios desde donde se pueden obtener genomas de referencias
- Biomart. Una base de datos desde donde puede obtenerse una cantidad ingente de datos de los genomas
- Phytozome. Otro portal desde donde puede obtenerse datos a partir de los genomas
- Base de datos SRA del NCBI (almacena datos y alineamientos de secuencias obtenidas mediante sistemas NGS) ya sean genomas como transcriptomas
- La base de datos ENA del EBI
B) Bases de datos desde donde se pueden obtener datos para aprender a procesar los datos
C) Programas que son capaces de mapear las lecturas de RNA a un genoma de referencia capaces o no de procesar el splicing
- Mapeadores que no reconocen el splicing (útil para organismos procariotas)
- Mapeadores que reconocen y permiten el mapeo de lecturas considerando el splicing
- Kallisto. Un nuevo programa que hace pseudoalineamientos..
- TopHat, que usa el ensamblador Bowtie. Un clásico. Este programa se puede usar con Cufflinks
- HISAT. Un sucesor de TopHat para el alineamiento de lecturas de RNA-Seq
- STAR, un programa en auge de mapeo extremadamente rápido
- Sailfish
D) Programas que son capaces de determinar el "conteo" de las lecturas a los genes una vez que se han mapeado a un genoma de referencia
E) Información y Tutoriales para filtrar los datos obtenidos de archivos SAM/BAM
F) Programas que analizan la expresión diferencial de genes con el RNA-Seq
- Paquetes que funcionan bajo R depositados en Bioconductor
(solo se mencionan los más conocidos)
- Programas independientes del paquete estadístico R
- Cufflinks: un programa clásico muy utilizado con TopHat. Se trata de ensamblador de transcriptoma y un estimador de abundancia de de transcritos para análisis de RNA-Seq
que normaliza los datos de conteo. Se puede usar con Cuffmerge (para obtener un ensamblado transcriptómico), Cuffdiff
(para ver la expresión diferencial) y CummeRbund (para
ver representado los datos). Representa uno de los pocos casos en los que se puede analizar el RNA-Seq sin usar R
G) Programas que analizan ayustamientos, límites y reorganizaciones de genes
- Trans-ABySS, un ensamblador para transcriptoma con secuencias cortas
- SOAPsplice, un ensamblador que funciona bajo Linux con secuencias Illumina
H) Programas capaces de ensamblar y generar transcriptomas
I) Programas para analizar los datos procesados por los ensambladores
- GeneScissors, un programa que trata de arreglar los mal alineamientos realizados con RNA-seq
- Trinity, un programa para el ensamblado trasnscriptómico de RNA-seq en proyectos que no contengan las secuencias del genoma de referencia (realiza un transcriptoma de novo con secuencias transcriptómicas)
J) Soluciones integradas y multiplataformas para RNA-Seq y otras utilidades
Bibliografía y publicaciones científicas relacionadas con el RNA-Seq
5. Aproximaciones al estudio de los RNA no codificantes
- Introducción a los lncRNA.
- Tipos de RNA no codificantes
- Aproximaciones al estudio de los lncRNA
- Biotinilación del RNA y CHiP reverso (reverse ChiP)
Más información
- lncBlog. Un blog con información sobre long non coding RNA
6. Small RNA
Más información