BIOTECNOLOGIA COMPUTACIONAL: BIOLOGIA DE SISTEMAS

Total de créditos ECTS: 3
Tipo de asignatura: Obligatoria

INTRODUCCIÓN

El progreso de la biología molecular, sobre todo a partir del desarrollo de las técnicas para obtención de datos a gran escala (high throughtput) permitirá la descripción detallada de los seres vivos en diferentes niveles (genómica, proteómica, transcriptómica, metabolómica, lipidómica, etc). La Bioinformática y la Biología Computacional facilitan, a través de desarrollos informáticos y de sistemas de almacenamiento y análisis de datos, las herramientas necesarias para ordenar y dar sentido a la gran cantidad de información obtenida.
La Teoría General de Sistemas (TGS) afirma que las propiedades de los sistemas no pueden ser descritas en términos de sus elementos separados, sino que su comprensión se presenta cuando se estudian globalmente. El análisis de la Biología de Sistemas constituye pues un nuevo paradigma de investigación en Biología. Constituye una estrategia holística, a partir los datos obtenidos en las anteriores áreas de conocimento, que describiría la estructura y los mecanismos de control de los fenómenos biológicos, en estado fisiológico o tras una perturbación, formulando modelos que expliquen las complejas interrelaciones moleculares (vías y rutas, redes, módulos, etc) que se producen en el interior de las células y en los organismos superiores.
Durante este curso, el alumno tomará contacto con los principales componentes del computador, conocerá los diferentes sistema operativos, aprenderá las nociones elementales sobre el trabajo en red así como a consultar los servidores más conocidos de bases de datos y servicios computacionales para solucionar problemas relacionados con genómica, proteómica y la biología de sistemas.


PROFESORADO
Coordinador: Francisco Pérez Jiménez. Catedrático de Patología y Clínica Médicas (Universidad de Córdoba). Coordinador del grupo de investigación del PAI "Nutrición y Enfermedad (CTS212)". Jefe del Servicio de Medicina Interna del Hospital Universitario Reina Sofía, Córdoba. 0,6 Créditos.
Profesores colaboradores:
Juan Ruano Ruiz. Profesor Colaborador de Departamento de Medicina-ORL-Dermatología de la UCO. Facultativo Especialista en Medicina Interna. Licenciado en Bioquímica. Investigador en formación del Instituto de Salud Carlos III, adscrito al Servicio de Medicina Interna del Hospital Universitario Reina Sofía, Córdoba. 1 Créditos.

Javier Delgado Lista. Profesor Colaborador de Departamento de Medicina-ORL-Dermatología de la UCO. Especialista en Medicina Interna. Investigador en formación del Instituto de Salud Carlos III, adscrito al Servicio de Medicina Interna del Hospital Universitario Reina Sofía, Córdoba. 0,8 Créditos.

José López Miranda: Profesor Titular de Patología y Clínica Médicas (Universidad de Córdoba), Coordinador del grupo de investigación del PAI "Interacción entre genes y ambiente (CTS 515). Facultativo del Servicio de Medicina Interna del Hospital Universitario Reina Sofía de Córdoba. Créditos: 0,6.


COMPETENCIAS U OBJETIVOS DE APRENDIZAJE
Esta asignatura cubrirá las siguientes competencias:

1.-Competencias específicas del Máster: 1.F; 1.G. (Ver lista de competencias del Master)
2.-Competencias genéricas o transversales: 2.A; 2.B; 2.C; 2.D; 2.G; 2.H. (Ver lista de competencias del Master)
3.-Competencias nucleares: 3.A; 3.C; 3.D. (Ver lista de competencias del Master)
4.-Competencias específicas de la propia asignatura (se incluyen a continuación):

Tabla 1.-Competencias específicas de la propia asignatura.

Conocimientos (Saber) Habilidades (Saber hacer)
Conocer como funciona un sistema computador y su diseño a nivel arquitectural. Ser capaz de identificar los componentes internos de un computador y los dispositivos E/S.
Conocer los conceptos básicos de red de computadores y comunicaciones. Ser capaz de diseñar un organigrama básico con los procesos necesarios para establecer un servidor de datos biológicos a través de internet.
Conocer cómo el Sistemas Operativos (SO) distribuye los recursos disponibles para atender las diversas peticiones de usuarios. Ser capaz de identificar los diferentes SO y las aplicaciones software de código abierto en soporte UNIX.
Conocer el concepto de base de datos relacionadas, la forma de describir su contenido y la relación entre sus datos. Ser capaz de realizar consultas en las BD de secuencias, tanto primarias como secundarias y compuestas.
Conocer algunos apectos básicos sobre los lenguajes de programación usados en Bioinformática (PERL, C). Se capaz de identificar los programas necesarios de comparación de secuencias de ácidos nucleicos y proteínas.
Conocer el concepto de minería de datos (data mining) aplicada al análisis de información biológica. Ser capaz de seleccionar aplicaciones computacionales para distinguir las regiones codificadoras de las no-codificadoras.
Conocer los métodos bioinformáticos para la predicción de la estructura de las proteínas (por homología, por threading y ab initio). Ser capaz de identificar los pasos clave en el estudio de filogenias para la identificación y predicción de funciones y/o estructuras de proteínas.
Conocer los métodos analíticos y computacionales aplicados al estudio en Metabolómica y Proteómica. Ser capaz de seleccionar aplicaciones para analizar los datos derivados de las tecnologías de secuenciación y detección de polimorfismos de ADN (SNPs) a nivel poblacional.
Conocer el concepto de Metacomputación y Grid Computing. Ser capaz de seleccionar aplicaciones informáticas para compar estructuras 3D de proteínas.
Conocer los aspectos básicos sobre la Teoría General de Sistemas. Ser capaz de identificar diferencias en los niveles de expresión de genes (microarrays) que permitan explicar los procesos biológicos.
Conocer los términos más empleados en el estudio de Biología de Sistemas. Ser capaz de identificar los recursos computacionales más importantes de la aplicación SBW para el estudio de Sistemas Biológicos.

METODOLOGÍA DOCENTE, ACTIVIDADES Y PROCEDIMIENTO DE EVALUACIÓN DEL ALUMNADO

METODOLOGÍA DOCENTE
Este curso se desarrollará a través de las actividades lectivas, prácticas y de evaluación, operando ya sea en grupos plenarios, en subgrupos o individualmente. Para ello se utilizarán el aula de teoría, el aula de informática y el aula virtual. En estos escenarios, se utilizarán como herramientas educativas:
a.-Unidades de estudio independiente, es decir, formas de estrategia y organización del estudio autónomas, propias de cada alumno o grupo de alumnos, para el tratamiento de un tema encomendado.
b.-La participación en las actividades comunes, como espacio de reflexión, producción y puesta a prueba colectiva e individual de resultados parciales o finales de los ejercicios propuestos.
c.-Lecturas dirigidas, bajo la forma de documentos propios y artículos científicos, orientados sobre la base del contenido del curso, proporcionados por el docente.
d.-Sesiones de tutoría y orientación individual.
e.-Acciones telemáticas (foros grupales en el Aula Virtual, consultas individuales por e-mail, circulación de trabajos preparatorios, "chat", teleconferencias, exámenes telemáticos).

A.-ACTIVIDADES PRESENCIALES (Total: 35h)
I.-Clases teóricas (Total: 13 horas)

Programación:

1.-Introducción a la Informática (3 horas)

1.1.-Arquitectura de Computadores e Introducción a las Redes (1 hora). Componentes del computador (software/hardware, periféricos, CPU). Introducción a la redes de computadores en informática. Grid Computing.

1.2.-Sistemas Operativos (SO) y Lenguajes de programación en Bioinformática (2 horas): Sistemas operativos: UNIX, Linux, Mac OS™, Windows™. Nociones sobre procesos, algoritmos y lenguajes de programación (PERL, C).

2.-Introducción a la Bioinformática (8 horas)

2.1.-Definición de Bioinformática (1 hora). ¿Qué es la Bioinformática?. Estado de la Bioinformática en Europa (Instituto Nacional de Bioinformática, European Bioinformatics Institute). The European Nutrigenomics Organitation (NuGo): el papel de la Bioinformática en el análisis de datos de genómica, transcriptómica, proteómica y metabolómica en relación con la Nutrición Humana.

2.2.-Bases de datos (1 hora). Clasificación de las bases de datos biológicas. Bases de Datos de Referencia. Utilización y servicios de Bases de datos Biológicas.

2.3.-Comparación de secuencias biológicas (1 horas). Uso de matrices (PAM y BLOSUM) y algoritmos (FASTA y BLAST) para la comparación simple por identidades y semejanza. Alineamientos múltiples (conceptos sobre programación dinámica, alineamiento progresivo y alineamiento jerárquico). Comparación de motivos (cadenas ocultas de Markov).

2.4.-Análisis de los polimorfismos genéticos a nivel poblacional. Estudios de Filogenia molecular (1 hora). SNPs y estudio haplotípicos. Definiciones de: número de sitios polimórficos (S) y de posiciones con inserción/delección (I), diversidad nucleotídica (?), parámetro mutacional (?), diversidad haplotípica (H) y desequilibrio de ligamiento (DL). Test del neutralismo y Teoría de la coalescencia. Herramientas bioinformáticas y servidores para el análisis de polimorfismos genéticos. Concepto y partes de los árboles evolutivos (ramas y nodos). Métodos de construcción de árboles (distancias y parsimonia). Conceptos de homología, analogía, ortología y paralogía. Utilidad de las filogenias en Genómica y Proteómica.

2.5.-Estructura de proteínas (1 hora). Bases biológicas acerca de la estructura de las proteínas y métodos experimentales para su determinación (difracción de rayos X, RMN, microscopía electrónica tridimensional). Métodos y herramientas bioinformáticas para la predicción de la estructura de proteínas (predicción por homología, predicción por threading y predicción ab initio). Validación de los modelos.

2.6.-Medida de datos de expresión génica y proteínas y extracción de conocimiento (KDD) (1 hora). Preprocesamiento, análisis e interpretación de la información proporcionada por los Micro y Macroarrays. Minería de datos o data mining. KDD. Patrones de expresión génica y procesos biológicos. Extracción de reglas entre genes.

2.7.-Introducción a la herramientas Bioinformáticas para el análisis de datos en estudios sobre Proteómica y Metabolómica (1 hora). Software para el análisis de geles bidimensionales y la identificación proteica por espectrofotometría de masas-masas.

2.8.-Bioinformática en la Web (1 hora). Servidores de Bases de datos (EMBL-EBI, DDBJ, Expasy, EMBnet, Bio-Mirror) y Servicios especializados (EMBOSS, Staden, PISE, wEMBOSS, FOLD, Clustal-W, T-Coffe, SwissModel, SDSS, CPHmodels).


3.-Introducción a la Biología de Sistemas (2 horas)

3.1.-Definición de Biología de Sistemas (1 hora). ¿Qué es la Teoría General de Sistemas?. ¿Y la Biología de Sistemas?. Las teorías preliminares: La Teoría de los Sistemas Bioquímicos (1960) y la Teoría de Control Metabólico (1970). Estado actual de la Biología de Sistemas en Europa (). Biología de Sistemas en relación con la Nutrición Humana.

3.2.-Definición de términos en Biología de Sistemas (1 hora): sistema, modelo, modularidad, control (PID control), comportamiento estático y dinámico, sensibilidad, robustez y reproducibilidad.

II.-Actividades prácticas (15 horas)
Las actividades prácticas se llevarán a cabo aprovechando la infraestructura del Aula Virtual y las aplicaciones Bioinformáticas y de Biología de Sistemas de código abierto disponibles.
A continuación se detallan, en relación a los diferentes bloques del curso, las actividades a realizar:
1.-Introducción a la Informática (5 horas):
a.-Arquitectura de computadores e iniciación a las redes (2'5 horas). El alumno identificará los componentes de su computador y diseñará el organigrama y los procesos necesarios para establecer un servidor de datos a través de Internet.

b.-Programación PERL (2'5 horas). El alumno aprenderá a utilizar el terminal del ordenador, como herramienta para conocer nociones básicas acerca de UNIX. Utilizando el editor de texto PICO, transcribirá varios programas sencillos desarrollados en PERL, con la finalidad de que entre en contacto con este tipo de lenguaje de programación utilizado en muchas de las aplicaciones desarrolladas en Bioinformática.

2.-Introducción a la Bioinformática (7,5 horas):
a.-Comparación de secuencias: Alineamiento simple y múltiple (2,5 horas). El alumno tendrá que obtener la secuencia del gen de la lipoprotein lipasa humana (GenID: 4023) procedente de la base de datos GeneBank. Debe: 1) Describir las características de este gen (ORF, zonas silenciadas, número de nucleótidos, cromosoma en que se encuentra, secuencia completa en formato FASTA); 2) Utilizará BLAST para el alineamiento con genes de otras especies con el fin de identificar las semejanzas (secuencia, domicios) entre secuencias.

b.- Análsis de proteínas (2,5 horas). El alumno debe consultar en la base de datos Swissprot a través del Servidor ExPASy para encontrar la secuencia de aminoácidos de lipoprotein lipasa humana (P06858). Con la información encontrada, debe: 1) Describir las características de esta proteína (número de aminoácidos, dominios, principales variantes polimórficas en la secuencia); 2) Utilizará Clustal-W en el Servidor de la EBI, para obtener alineamientos múltiples con la secuencia aminoacídica obtenida; 3) Seleccionará las secuencias (4) con mejor puntuación a las que se ha enfrentado la de la lipoprotein lipasa e identificará los dominios que guardan mejor homología.

c.-Modelado de proteínas (2,5 horas). El alumno debe utilizar Swiss-3Dimage de ExPASy para obtener el modelo en 3D de la lipoproteina lipasa. Guardará la imagen en un fichero .jpg y la envairá al tutor.

3.-Introducción a la Biología de Sistemas (2,5 horas):
a.-Simulación de modelos biológicos (2,5 horas). El alumno aprenderá las nociones básicas de la aplicación SBW v 2.5.0 para el estudio de Sistemas Biológicos.

III.-Tutorías. (Total: 5 horas)
Orientación, seguimiento del aprendizaje del alumno y aclaración de dudas.

IV.-Examen test y supuestos prácticos. (Total: 3 horas)


B.-ACTIVIDADES DIRIGIDAS NO PRESENCIALES (Total: 15 h)

I.-Enseñanza para el autoaprendizaje y uso del inglés: 5 h
El alumno desarrollará a lo largo del curso un dossier en inglés que incluya las noticias sobre novedades acerca de recursos y servidores en el campo de la Bioinformática aplicada a la nutrición.

II.-Aula virtual: 10 h
El alumno debe participar en el foro de la plataforma de forma activa y diaria, ya que la interacción con el profesor y el resto de alumnos es considerada fundamental para el proceso de aprendizaje con este método de enseñanza.

Tabla 2.- Resumen de distribución de horas por las distintas actividades.

 
Horas presenciales
Horas no presenciales
Horas de trabajo personal
Total de horas
Clases teóricas
13
13
Prácticas en aula de informática
15
15
Tutorías personales y grupales
5
5
Examen
2
2
Actividades dirigidas no presenciales (aula virtual y autoaprendizaje)
10
10
Horas de estudio de teoría
20
20
Horas de estudio de prácticas
10
10
 
35
10
30
75


CRITERIOS Y MÉTODOS DE EVALUACIÓN

1.-Criterios cualitativos de evaluación:
-Nivel de aprendizaje alcanzado
-Capacidad para resolver problemas de forma personal
-Capacidad para mantenerse informado de forma personal
-Capacidad para integrar sus conocimientos y expresarlos de forma oral y escrita
-Sentido crítico y capacidad de generar ideas
-Habilidad técnica
2.-Métodos de evaluación:
-Examen de test de elección múltiple, para explorar conceptos teóricos.
-Prueba escrita sobre 2 supuestos prácticos para resolución de problemas.
-Evaluación continuada en las prácticas del aula y el laboratorio de informática.
-Calidad del trabajo personal realizado en el aula virtual.
-Calidad del trabajo personal de autoaprendizaje.
-Participación en las tutorías.
3.-Criterios cuantitativos de evaluación:
-Cumplimiento de las horas presenciales: 1 punto.
-Examen test: 1 punto.
-Prueba escrita: 1 punto.
-Evaluación continuada de las prácticas: 2 puntos.
-Calidad del trabajo en el aula virtual: 2 puntos.
-Calidad del trabajo de actualización: 2 puntos.
-Participación en las tutorías: 1 punto.

RECURSOS PARA EL APRENDIZAJE
1.-Comunes al resto de las asignaturas.
2.-Específicos: Aula de informática, aplicaciones de Bioinformáticas y Biología de Sistemas de software libre.

IDIOMA EN QUE SE IMPARTE
Español, con documentación y actividades en inglés.

BIBLIOGRAFÍA

Ivakhno S. From functional genomics to systems biology. FEBS J. 2007 May;274(10):2439-48. Epub 2007 Apr 19. Review.

Turchin A, Kohane IS. Gene homology resources on the World Wide Web.Physiol Genomics. 2002 Dec 3;11(3):165-77. Epub 2002 Dec 3.

Sharan R, Ulitsky I, Shamir R. Network-based prediction of protein function. Mol Syst Biol. 2007;3:88. Epub 2007 Mar 13. Review. 

Enlaces web:

NCBI: http://www.ncbi.nlm.nih.gov/

EBI: http://www.ebi.ac.uk/

UniProt/SwissProt: http://www.ebi.uniprot.org/index.shtml

HapMap: http://www.hapmap.org/

Aplicaciones:

Blast2 del EBI: http://www.ebi.ac.uk/blast2/

ClustalW del EBI: http://www.ebi.ac.uk/clustalw/

Cytoscape: http://www.cytoscape.org/

ReadSeq: http://www-bimas.cit.nih.gov/molbio/readseq/