En el caso de las comparaciones de matrices de puntos (Dot matrix analysis)

  • Se recomienda este método como el primer tipo de comparación que debería realizarse con las secuencias de proteínas como de ácidos nucleicos, por que: 
    • proporciona una interfaz gráfica que permite revelar la homologías de las secuencias de una forma visual y por tanto, mucho más intuitiva para el usuario final.
    • es el único método que permite revelar los alineamientos de secuencias que tienen lugar en diferentes partes de las secuencias.
    • permite desvelar varios alineamientos al mismo tiempo.
    • es capaz de revelar la presencia de inserciones y deleciones en las secuencias, 
    • Destaca las repeticiones directas e invertidas 
    • Permite encontrar secuencias de RNA que son auto complementarias y tienen el potencial de formar estructuras secundarias.
     
Programas independientes que pueden realizar comparaciones de matrices de datos 
  • El más recomendado es el magnifico programa Dotlet, de libre acceso y que funciona bajo JAVA y puede por tanto usarse desde exploradores como Internet Explorer o Netscape.
  • El programa DOTTER, bajo X-Windows (UNIX). Éste debe descargarse de la página e instalarse en un ordenador local.
 

RECOMENDACIONES Y CONSEJOS

Cuando hagamos comparaciones usando las técnicas de matriz de puntos (dot-plot), será necesario definir una estrategia de comparación basado en la definición de la llamada ventana, que no es más que el número de bases o aminoácidos que deben ser considerados en las comparaciones. 

Por ejemplo, en las comparaciones con secuencias de ácidos nucleicos podría ser conveniente indicar que se use una ventana de 25 bases,, y que sea considerada una comparación significativa si 12 de esas bases coinciden entre las dos secuencias que se comparan. 

Las recomendaciones son: 

  1. La mejor de todas es que NO existen normas fijas que permitan obtener siempre buenos resultados. Es mejor realizar siempre varias comparaciones y bajo diferentes condiciones de estringencia hasta encontrar los resultados más satisfactorios.
  2. En general hay, si se quiere compara secuencias de ácidos nucleicos, resulta recomendable seleccionar vantanas de mayor longitud que cuando se comparan secuencias de proteínas. Esto se debe, entre otros hechos, a que las coincidencias aleatorias que suceden en el DNA, que tiene 4 bases, son mucho más frecuentes que lo que puede ocurrir con las proteínas que están constituidas por 20 aminoácidos diferentes. Vease la tabla y úsese como una guía genérica.
     
    Tipo de Secuencia
    Consideraciones / Observaciones
    Ventana Recomendada / Coincidencias
    Ácidos Nucleicos
    Búsquedas convencionales
    15-20 bases / 10-15 coincidencias
    Ácidos Nucleicos / Proteínas
    Búsqueda de dominios o estructuras ya definidas o conocidas
    Doble de la longitud de la secuencia buscada / 60% de la longitud (1)
    Proteínas (2)
    No se sospecha similitud entre las dos proteínas
    2-3 aa / 2 coincidencias
    Proteínas (2)
    Proteínas relacionadas, pero con largos trechos no similares
    20 aa / 5 coincidencias
     
(1) Por ejemplo, si se sospecha un dominio del DNA constituido por unas 15 bases, la ventana se definirá con una longitud de 30 bases y una coincidencia de al menos 18 bases

(2) IMPORTANTE: En las comparaciones realizadas con las proteínas se pueden usar varias matrices de comparaciones diferentes (tipos BLOSUM, PAM) que consideran que o bien tiene que existir una identidad total en las secuencias que se comparan, o bien se consideran familias relacionadas de aminoácidos en las que se asume que algunos aminoacidos pueden ser sustituidos por otros sin que la actividad biológica de la proteína se vea alterada. En este documento se discute sobre las diferentes matrices de comparaciones.