- Utilidad
del alineamiento y comparación de las secuencias
- Para descubrir secuencias biológicas (ácidos nucleicos y proteínas) con funciones similares buscando simplemente otras secuencias que se parecen a la nuestra.
- Para descubrir familias de secuencias biológicas con funciones compatidas.
- Para descubrir dominios conservados en las secuencias tanto de ácidos nucleicos como de proteínas.
- Descubrir información sobre la función, estructura o evolución de las secuencias biológicas con la que trabajamos.
- Para encontrar elementos como secuencias repetidas ya sean directas o invertidas, terminadores, palíndromes, regiones de baja complejidad, o cualquier otro que pudiera tener alguna significación biológica.
- Útil para establecer relaciones filogenéticas entre ácidos nucleicos y proteínas.
- Cuando se desea encontrar intrones y exones en la secuencia
- Útil para el diseño de cebadores para la clonación de genes mediante PCR
- Alíneamientos
Globales y Locales de las secuencias
- Criterios de idéntidad y de similaridad u homología.
- Criterio de identidad en las secuencias de bases de ácidos nucleicos
- Criterio de identidad y homología en las secuencias de proteínas
- Uso de las Matrices de
Comparaciones cuando comparamos proteínas: matrices BLOSUM y PAM.
- Criterio de score (puntuación) de los alineamientos
- Criterios de gap (huecos) y extensiones. Cómo afectan el tipo de alineamiento
- Métodos
de Alineamientos de Pares de Secuencias
- Introducción a los diferentes elementos reguladores
- Uso para identificar elementos reguladores (terminadores, secuencias repetidas y directas..)
- Uso para encontrar regiones de baja complejidad
- Uso para encontrar dominios con actividad biológica en secuencias de proteinas y acidos nucleicos.
- Uso para encontrar intrones y exones
- Uso para encontrar mutaciones y frame shifts (cambios de fases)
- Método
k-tuple de definición de palabras, que usan programas como
BLAST (comparaciones
locales) y FASTA (comparaciones globales)
- Usos
de BLAST: búsqueda de regiones locales conservados
entre diferentes proteínas y ácidos nucleicos.
- Tipos de Blast: (de proteínas
con bases de datos de ácidos nucleicos)
- blastn: DNA x DNA
blastp: protein x protein
blastx: DNA x protein
tblastn: DNA vs DNA, translated
tblastx: protein x DNA
- Un documento pdf que sirve como guía para el uso de BLAST
- Usos
y aplicaciones de los diferentes tipos de BLAST
- Información obtenible desde un fichero de BLAST
- Secuencia Query y Subject
- Valores estadísticos ofrecidos por Blast
- Score (continuo y discontínuo)
- Valor de E. Significación e interpretación
- Identidad (para AN) y homología (para Proteínas)
- Porcentaje de cobertura en la comparación
- Tipo de alineamiento en los ácidos nucleicos (Plus/Plus o Plus/minus). Interpretación y manejo.
- Tipo de alineamientos en las proteínas (número de fase de lectura)
- Coordenadas del alineamiento. Diferencias con lo aportado por BLASTX
- Tipos especializados de Blast con proteínas que ayuda a encontrar proteínas homólogas distantes
- PSI-BLAST (crea matriz comparación tras hacer un BLASTP). Usa proteína AAL80910 como ejemplo
- PHI-BLAST (usando expresiones regulares para definir dominios para las búsquedas). Ayuda
- DELTA-BLAST (crea matriz comparación usando Conserved Domain Database)
- Referencias cruzadas a bases de datos como GO, InterPro y KEGG.
- Blast masivos con programas usando Blast2Go (programa externo de pago, pero con modalidad gratuita)
- Uso de Blast con bases de datos locales
- generación de las bases de datos locales
- Uso de la opción -remote para ejecutar BLAST localmente con bases de datos remotas.
- Uso del Blast con secuencias SRA (herramientas sratools)
- Usos
de la suite de programas FASTA (no confundir con el formato de archivo): reconocimiento de familia de ácidos nucleicos
y proteínas relacionadas.
- Páginas WEB donde
se encuentran servidores y programas
que permiten realizar alineamientos de pares de secuencias.
Prácticas
y Problemas |