Tema 3. Alineamiento y Comparación de Dos Secuencias

 

  • Utilidad del alineamiento y comparación de las secuencias
    • Para descubrir secuencias biológicas (ácidos nucleicos y proteínas) con funciones similares buscando simplemente otras secuencias que se parecen a la nuestra.
    • Para descubrir familias de secuencias biológicas con funciones compatidas.
    • Para descubrir dominios conservados en las secuencias tanto de ácidos nucleicos como de proteínas.
    • Descubrir información sobre la función, estructura o evolución de las secuencias biológicas con la que trabajamos.
    • Para encontrar elementos como secuencias repetidas ya sean directas o invertidas, terminadores, palíndromes, regiones de baja complejidad, o cualquier otro que pudiera tener alguna significación biológica.
    • Útil para establecer relaciones filogenéticas entre ácidos nucleicos y proteínas.
    • Cuando se desea encontrar intrones y exones en la secuencia
    • Útil para el diseño de cebadores para la clonación de genes mediante PCR

 


 

  • Métodos de Alineamientos de Pares de Secuencias 
        • Introducción a los diferentes elementos reguladores
        • Uso para identificar elementos reguladores (terminadores, secuencias repetidas y directas..)
        • Uso para encontrar regiones de baja complejidad
        • Uso para encontrar dominios con actividad biológica en secuencias de proteinas y acidos nucleicos.
        • Uso para encontrar intrones y exones
        • Uso para encontrar mutaciones y frame shifts (cambios de fases)

         

      • Método k-tuple de definición de palabras, que usan programas como BLAST (comparaciones locales) y FASTA (comparaciones globales)
        • Usos de BLAST: búsqueda de regiones locales conservados entre diferentes proteínas y ácidos nucleicos.
          • Tipos de Blast: (de proteínas con bases de datos de ácidos nucleicos)
              • blastn: DNA x DNA
                blastp: protein x protein
                blastx: DNA x protein
                tblastn: DNA vs DNA, translated
                tblastx: protein x DNA
            • Un documento pdf que sirve como guía para el uso de BLAST
            • Usos y aplicaciones de los diferentes tipos de BLAST
            • Información obtenible desde un fichero de BLAST
              • Secuencia Query y Subject
              • Valores estadísticos ofrecidos por Blast
                • Score (continuo y discontínuo)
                • Valor de E. Significación e interpretación
                • Identidad (para AN) y homología (para Proteínas)
                • Porcentaje de cobertura en la comparación
              • Tipo de alineamiento en los ácidos nucleicos (Plus/Plus o Plus/minus). Interpretación y manejo.
              • Tipo de alineamientos en las proteínas (número de fase de lectura)
              • Coordenadas del alineamiento. Diferencias con lo aportado por BLASTX
            • Tipos especializados de Blast con proteínas que ayuda a encontrar proteínas homólogas distantes
              • PSI-BLAST (crea matriz comparación tras hacer un BLASTP). Usa proteína AAL80910 como ejemplo
              • PHI-BLAST (usando expresiones regulares para definir dominios para las búsquedas). Ayuda
              • DELTA-BLAST (crea matriz comparación usando Conserved Domain Database)
            • Referencias cruzadas a bases de datos como GO, InterPro y KEGG.
            • Blast masivos con programas usando Blast2Go (programa externo de pago, pero con modalidad gratuita)
            • Uso de Blast con bases de datos locales
              • generación de las bases de datos locales
              • Uso de la opción -remote para ejecutar BLAST localmente con bases de datos remotas.
              • Uso del Blast con secuencias SRA (herramientas sratools)
        • Usos de la suite de programas FASTA (no confundir con el formato de archivo): reconocimiento de familia de ácidos nucleicos y proteínas relacionadas.

         

       
  • Páginas WEB donde se encuentran servidores y programas que permiten realizar alineamientos de pares de secuencias.

Prácticas y Problemas