Datos Identificativos 2018/19
Asignatura (*) Probabilidad. estadística y elementos de biomatemática Código 614522007
Titulación
Mestrado Universitario en Bioinformática para Ciencias da Saúde
Descriptores Ciclo Periodo Curso Tipo Créditos
Máster Oficial 1º cuatrimestre
Primero Obligatoria 6
Idioma
Castellano
Gallego
Inglés
Modalidad docente Presencial
Prerrequisitos
Departamento Matemáticas
Coordinador/a
Correo electrónico
Profesorado
Cao Abad, Ricardo
Correo electrónico
ricardo.cao@udc.es
Web http://dm.udc.es/profesores/ricardo/
Descripción general Preténdese que os alumnos adquiran competencias na identificación de situacións nas que a teoría de probabilidade e os métodos da inferencia estatística son ferramentas axeitadas para a análise cuantitativa de bases de datos xerados na área de bioinformática. Para iso, tratarase de que os estudantes complementen o seu coñecemento dos conceptos básicos de probabilidade e inferencia estatística, obteñan soltura no manexo do software estatístico R, utilizando un gran número de recursos, e que o alumno se introduza na programación nesta contorna. Tamén preténdese que os alumnos se familiaricen cos modelos probabilísticos de procesos estocásticos en tempo discreto e adquiran unha formación básica en técnicas de remostraxe (Bootstrap) como ferramenta para a posta en marcha e avaliación de diferentes algoritmos estatísticos.


Competencias
COMPETENCIAS DEL TíTULO
TipoA Código  
  Profesionalizador
  AP5 CE5 - Desarrollo de habilidades en el manejo de técnicas estadísticas y su aplicación a conjuntos de datos del campo de la Bioinformática
  AP6 CE6 - Capacidad para identificar las herramientas software y fuentes de datos de bioinformática más relevantes, y adquirir destreza en su uso
  AP10 CE10 - Elaborar un proyecto de investigación bioinformática, anticipando obstáculos y las posibles estrategias alternativas para solucionarlos.
TipoB Código  
  Profesionalizador
  BP1 CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
  BP4 CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
  BP5 CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida auto dirigido o autónomo.
TipoC Código  
  Profesionalizador
  CP3 CT3 - Utilizar las herramientas básicas de las tecnologías de la información y las comunicaciones (TIC) necesarias para el ejercicio de su profesión y para el aprendizaje a lo largo de su vida
  CP6 CT6 - Valorar críticamente el conocimiento, la tecnología y la información disponible para resolver los problemas con los que deben enfrentarse
  CP8 CT8 - Valorar la importancia que tiene la investigación, la innovación y el desarrollo tecnológico en el avance socioeconómico y cultural de la sociedad

Objetivos de aprendizaje

Contenidos
Tema Subtema
1. Revisión de conceptos básicos de probabilidad y estadística.
a. Probabilidad. Variables aleatorias y distribuciones notables discretas y continuas. Distribuciones multivariantes.
b. Inferencia estadística: estimación, contrastes de hipótesis e intervalos de confianza.
2. Revisión del lenguaje de programación estadístico R. a. Introdución al R. Primeros pasos. Funciones internas. Ayuda en R. Funciones, bucles, vectores. Funciones estadísticas. Gráficas. Recursividad. R studio.
b. Principales distribuciones de probabilidad en R.
c. Introducción a la simulación en R.
d. Estadística descriptiva en R.
e. Contrastes de hipótesis e intervalos de confianza con R.
3. Modelos estadísticos lineales. a. El modelo de regresión lineal simple. Hipótesis básicas. Estimación. Contrastes. Predicción. Diagnosis del modelo.
b. El modelo de regresión lineal múltiple. Hipótesis básicas. Estimación. Contrastes. Predicción. Diagnosis del modelo.
c. Modelos básicos del diseño experimental. Análisis de la Varianza (ANOVA) de una y dos vías, sin y con interacción. Hipótesis básicas. Estimación. Contrastes. Diagnosis del modelo.
d. El problema de los contrastes múltiples. False discovery rate.
4. Introducción a los procesos estocásticos. a. Paseo aleatorio simple.
b. Proceso de Poisson y procesos de renovación. Procesos de nacimiento y muerte.
c. Procesos Markovianos. Cadenas de Markov.
5. Introducción a los métodos de remuestreo. a. El bootstrap uniforme. Cálculo de la distribución bootstrap: distribución exacta y distribución aproximada por Monte Carlo. Ejemplos. Aplicación del bootstrap a la estimación de la precisión y el sesgo de un estimador.
b. Modificaciones del Bootstrap uniforme. Bootstrap paramétrico, simetrizado y suavizado. Discusión y ejemplos.
c. Métodos bootstrap para la construcción de intervalos de confianza: método percentil, percentil-t, percentil-t simetrizado. Ejemplos.
Estudios de simulación.

Planificación
Metodologías / pruebas Competéncias Horas presenciales Horas no presenciales / trabajo autónomo Horas totales
Presentación oral A5 A6 A10 B1 B4 B5 C8 24 36 60
Prácticas a través de TIC A5 A6 A10 B4 B5 C3 C6 18 36 54
Prueba de respuesta múltiple A5 B1 B5 C8 1 9 10
Solución de problemas A5 A6 A10 B1 B4 B5 C3 C6 C8 4 16 20
 
Atención personalizada 6 0 6
 
(*)Los datos que aparecen en la tabla de planificación són de carácter orientativo, considerando la heterogeneidad de los alumnos

Metodologías
Metodologías Descripción
Presentación oral Presentación con ordenador.
Prácticas a través de TIC Análisis estadístico de conjuntos de datos usando R.
Prueba de respuesta múltiple Prueba de repuesta múltiple sobre conceptos.
Solución de problemas Elección de las herramientas estadísticas y estrategias para resolver problemas. Formulación de modelos lineales. Diseño de experimentos. Formulación de planes de remuestreo.

Atención personalizada
Metodologías
Prácticas a través de TIC
Solución de problemas
Descripción
Asistencia y participación en las clases teóricas.
Examen escrito de múltiple opción.
Participación en prácticas y seminarios.
Supuesto práctico a realizar por el alumno.

Evaluación
Metodologías Competéncias Descripción Calificación
Prácticas a través de TIC A5 A6 A10 B4 B5 C3 C6 Práctica de ordenador usando el software estadístico libre R. 20
Solución de problemas A5 A6 A10 B1 B4 B5 C3 C6 C8 Trabajo original sobre alguno de los temas de la materia en un contexto de interés en Bioinformática. 40
Prueba de respuesta múltiple A5 B1 B5 C8 Prueba de comprensión de los conceptos impartidos. 40
 
Observaciones evaluación

La evaluación se realizará por medio de una prueba sobre
prácticas con R, un trabajo individual del/a alumno/a, así como una
prueba escrita de conceptos. La calificación de la prueba de
conceptos representará el 40% de la calificación global, la prueba de
prácticas en R corresponderá al 20% mientras que el 40% restante
corresponderá al trabajo individual, que ha de ser presentado en público
por los alumnos.

Para superar la materia será necesario obtener una calificación de, por lo menos, 5 sobre 10 en el conjunto de la materia.

En la
oportunidad de julio, los alumnos podrán liberarse de hacer las pruebas
correspondentes en las que su calificación en la
oportunidad de enero haya sido de, por lo menos, 4 sobre 10.

En la primera oportunidad (enero-febrero), solo los alumnos que se hayan presentado a ninguna de las pruebas evaluables que figuran
arriba obtendrán la calificación de NO PRESENTADO. En julio, obtendrán la calificación de NO PRESENTADO los alumnos que no se hayan presentado al examen final de esa fecha.


Fuentes de información
Básica Cao Abad, R., Francisco Fernández, M., Naya Fernández, S., Presedo Quindimil, M.A., Vázquez Brage, M (2001). Introducción a la Estadística y sus Aplicaciones. Pirámide
Ewens, W.J. and Grant, G.R. (2005). Statistical Methods in Bioinformatics. Springer
Peña Sánchez de Rivera, D. (2000). Estadística: Modelos y Métodos. Alianza Editorial
Ross, S.M. (1995). Stochastic Processes. Wiley
Efron, B. and Tibshirani, R.J. (1993). An Introduction to the Bootstrap. Chapman and Hall
Davison, A.C. and Hinkley, D.V. (1997). Bootstrap Methods and their Application. Cambridge University Press
Complementária


Recomendaciones
Asignaturas que se recomienda haber cursado previamente

Asignaturas que se recomienda cursar simultáneamente
Introducción a las bases de datos/614522002
Genómica/614522006
Fundamentos de bioinformática/614522008
Introducción a la programación/614522001
Fundamentos de inteligencia artificial/614522003

Asignaturas que continúan el temario
Estructuras de datos y algoritmia para secuencias biológicas/614522013
Procesamiento avanzado de secuencias biológicas/614522020
Inteligencia computacional para datos de alta dimensionalidad/614522024
Trabajo fin de máster/614522025
Inteligencia computacional para bioinformática/614522012
Métodos estadísticos avanzados en bioinformática/614522009

Otros comentarios


(*) La Guía Docente es el documento donde se visualiza la propuesta académica de la UDC. Este documento es público y no se puede modificar, salvo cosas excepcionales bajo la revisión del órgano competente de acuerdo a la normativa vigente que establece el proceso de elaboración de guías