Preténdese que os alumnos adquiran competencias na identificación de situacións nas que a teoría de probabilidade e os métodos da inferencia estatística son ferramentas axeitadas para a análise cuantitativa de bases de datos xerados na área de bioinformática. Para iso, tratarase de que os estudantes complementen o seu coñecemento dos conceptos básicos de probabilidade e inferencia estatística, obteñan soltura no manexo do software estatístico R, utilizando un gran número de recursos, e que o alumno se introduza na programación nesta contorna. Tamén preténdese que os alumnos se familiaricen cos modelos probabilísticos de procesos estocásticos en tempo discreto e adquiran unha formación básica en técnicas de remostraxe (Bootstrap) como ferramenta para a posta en marcha e avaliación de diferentes algoritmos estatísticos.
Competencias do título
Código
Competencias / Resultados do título
A5
CE5 – Desenvolvemento de habilidades no manexo de técnicas estatísticas e a súa aplicación a conxuntos de datos no campo da Bioinformática
A6
CE6 – Capacidade para identificar as ferramentas software e fontes de datos de bioinformática máis relevantes, e adquirir destreza no seu uso
A10
CE10 - Elaborar un proxecto de investigación bioinformática, anticipando obstáculos e as posibles estratexias alternativas para solucionalos.
B1
CB6 – Posuír e comprender o coñecemento que fornecen unha base ou oportunidade de orixinalidade no desenvolvemento e / ou aplicación de ideas, a miúdo nun contexto de investigación.
B4
CB9 - Que os estudantes saiban comunicar as súas conclusións e os coñecementos e principios subxacentes a públicos especializados e non especializados, de xeito claro e inequívoco
B5
CB10 – Que os estudantes posúan as habilidades de aprendizaxe que lles permitan continuar estudando dun xeito que terá de ser en gran parte auto-orientado ou autónomo.
C3
CT3 - Utilizar as ferramentas básicas das tecnoloxías da información e as comunicacións (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida
C6
CT6 - Valorar criticamente o coñecemento, a tecnoloxía e a información dispoñibles para resolver os problemas cos que deben enfrontarse
C8
CT8 - Valorar a importancia que ten a investigación, a innovación e o desenvolvemento tecnolóxico no avance socioeconómico e cultural da sociedade
Resultados de aprendizaxe
Resultados de aprendizaxe
Competencias / Resultados do título
G2 - Capacidade de aplicación de algoritmos de resolución dos problemas e manexo do software adecuado.
AP5 AP6 AP10
BP1
CP3
G1 - Capacidade para iniciar a investigación e para participar en proxectos de investigación que poden culminar na elabouración duhna teses de doutoramento.
AP5 AP6 AP10
BP1 BP4 BP5
CP3 CP6 CP8
G3 - Capacidade de traballo en equipo e de xeito autónomo
AP5 AP6
BP1 BP4 BP5
CP3 CP6 CP8
G4 - Capacidade de formular problemas en termos estatísticos, e de resolvelos utilizando as técnicas axeitadas.
AP5 AP6 AP10
BP1
CP3 CP6
G6 - Capacidade de identificar e resolver problemas
AP5 AP6 AP10
BP1 BP5
CP3
G10 - Capacidade de integrarse nun equipo multidisciplinar para a análise experimental
AP5 AP6 AP10
BP1 BP4 BP5
CP3 CP6 CP8
G11 - Adquirir destreza para o desenvolvemento de software
AP5 AP6
BP5
CP3
G12 - Capacidade de análise estatística crítica das mostras, os plantexamentos e resultados
AP5 AP10
BP1 BP5
CP6 CP8
G14 - Representar un problema real mediante un modelizado estatístico axeitado.
AP5 AP6 AP10
BP1 BP5
G15 - Deseñar un plano de observación ou recollida de datos que permita abordar o problema de interese
AP5 AP6 AP10
BP1 BP5
CP3 CP6
E2 - A adquisición dos coñecementos de estatística e investigación de operacións necesarios para a incorporación en equipos multidisciplinares pertencentes a diferentes sectores profesionais.
AP5 AP6 AP10
BP1 BP4 BP5
CP3 CP6 CP8
E4 - Coñecer as aplicacións dos modelos da estatística e a investigación de operacións.
AP5 AP10
BP1 BP4 BP5
CP6
E5 - Coñecer algoritmos de resolución dos problemas e manexar o software axeitado.
AP5 AP6 AP10
BP1 BP5
CP3 CP6 CP8
E12 - Realizar inferencias respecto aos parámetros que aparecen no modelo.
AP5 AP6 AP10
BP1 BP4 BP5
CP3 CP6 CP8
E19 - Tratamento de datos e análise estatística dos resultados obtidos.
AP5 AP6 AP10
BP1 BP4 BP5
CP3
E27 - Obter os coñecementos precisos para unha análise crítica e rigurosa dos resultados.
AP5 AP10
BP1 BP4 BP5
CP6 CP8
E28 - Complementar a aprendizaxe dos aspectos metodolóxicos con apoio de software.
AP6 AP10
BP5
CP3 CP6 CP8
E78 - Fomentar a sensibilidade cara os principios do pensamento científico, favorecendo as actitudes asociadas ao desenvovemento dos métodos matemáticos, como: o cuestionamento das ideas intuitivas, a análise crítica das afirmacións, a capacidade de análise e síntese ou a toma de decisións racionais
AP5 AP10
BP1 BP4 BP5
CP6 CP8
E82 - O estudiante será capaz de comprender a importancia da Inferencia Estatística como ferramenta de obtención de información sobre a población en estudo, a partir do conxunto de datos observados dunha mostra representativa de esta. Para iso deberá recoñecer a diferenza entre estatística paramétrica e non paramétrica.
AP5 AP10
BP1 BP4 BP5
CP6 CP8
E84 - Ser quen de manexar diverso software (en particular R) e interpretar os resultados que proporcionan nos correspondentes estudos prácticos.
AP5 AP6 AP10
BP4 BP5
CP3
E86 - Soltura no manexo da teoría da probabilidade e as variables aleatorias.
AP5 AP10
BP1 BP4 BP5
CP6
Contidos
Temas
Subtemas
1. Revisión de conceptos básicos de probabilidade e estatística.
a. Probabilidade. Variables aleatorias e distribucións notables discretas e continuas. Distribucións multivariantes.
b. Inferencia estatística: estimación, contrastes de hipóteses e intervalos de confianza.
2. Revisión da linguaxe de programación estatística R.
a. Introdución ao R. Primeiros pasos. Funcións internas. Axuda en R. Funcións, bucles, vectores. Funcións estatísticas. Gráficas.
Recursividade. R studio.
b. Principais distribucións de probabilidade en R.
c. Introdución á simulación en R.
d. Estatística descritiva en R.
e. Contrastes de hipóteses e intervalos de confianza con R.
3. Modelos estatísticos lineais.
a. O modelo de regresión linear simple. Hipóteses básicas. Estimación. Contrastes. Predición. Diagnose do modelo.
b. O modelo de regresión linear múltiple. Hipóteses básicas. Estimación. Contrastes. Predición. Diagnose do modelo.
c. Modelos básicos do deseño experimental. Análise da Varianza (ANOVA) dunha e dúas vías, sen e con interación. Hipóteses básicas. Estimación. Contrastes. Diagnose do modelo.
d. O problema dos contrastes múltiples. False discovery rate.
4. Introdución aos procesos estocásticos.
a. Paseo aleatorio simple.
b. Proceso de Poisson e procesos de renovación. Procesos de nacemento e morte.
c. Procesos Markovianos. Cadeas de Markov.
5. Introdución aos métodos de remostraxe.
a. O Bootstrap uniforme. Cálculo da distribución Bootstrap: distribución exacta e distribución aproximada por Monte Carlo. Exemplos. Aplicación do Bootstrap á estimación da precisión e o nesgo dun estimador.
b. Modificacións do Bootstrap uniforme. Bootstrap paramétrico, simetrizado e suavizado. Discusión e exemplos.
c. Métodos bootstrap para a construción de intervalos de confianza: método percentil, percentil-t, percentil-t simetrizado. Exemplos.
Estudos de simulación.
Planificación
Metodoloxías / probas
Competencias / Resultados
Horas lectivas (presenciais e virtuais)
Horas traballo autónomo
Horas totais
Presentación oral
A5 A6 A10 B1 B4 B5 C8
24
36
60
Prácticas a través de TIC
A5 A6 A10 B4 B5 C3 C6
18
36
54
Proba de resposta múltiple
A5 B1 B5 C8
1
9
10
Solución de problemas
A5 A6 A10 B1 B4 B5 C3 C6 C8
4
16
20
Atención personalizada
6
0
6
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado
Metodoloxías
Metodoloxías
Descrición
Presentación oral
Presentación con ordenador
Prácticas a través de TIC
Análise estatística de conxuntos de datos usando R.
Proba de resposta múltiple
Proba de reposta múltiple sobre conceptos.
Solución de problemas
Elección das ferramentas estatísticas e estratexias para resolver problemas. Formulación de modelos lineais. Deseño de experimentos. Formulación de plans de remostraxe.
Atención personalizada
Metodoloxías
Prácticas a través de TIC
Solución de problemas
Descrición
Asistencia e participación nas clases teóricas.
Exame escrito de múltiple opción.
Participación en prácticas e seminarios.
Suposto práctico a realizar polo alumno.
Avaliación
Metodoloxías
Competencias / Resultados
Descrición
Cualificación
Presentación oral
A5 A6 A10 B1 B4 B5 C8
Presentación oral do traballo orixinal mencionado no item "Solución de problemas" e seguimento continuado e obxectivable dunha participación activa.
10
Prácticas a través de TIC
A5 A6 A10 B4 B5 C3 C6
Práctica de ordenador usando o software estatístico libre R.
30
Solución de problemas
A5 A6 A10 B1 B4 B5 C3 C6 C8
Traballo orixinal sobre algún dos temas da materia nun contexto de interés en Bioinformática e seguimento continuado e obxectivable dunha participación activa.
30
Proba de resposta múltiple
A5 B1 B5 C8
Proba de comprensión dos conceptos impartidos.
30
Observacións avaliación
A avaliación realizarase por medio dunha proba sobre
prácticas con R, un traballo individual do/da alumno/a, así como unha
proba escrita de conceptos. A calificación da proba de
conceptos representará o 30% da calificación global, a proba de
práctica en R corresponderá ao 30% mentres que o 40% restante
corresponderá ao traballo individual, que ten que ser presentado en público
polos estudantes. A cuarta parte da puntuación deste traballo individual (10% da cualificación global) corresponde á presentación oral do mesmo.
Para superar a materia será necesario obter unha calificación de alomenos 5 sobre 10 no conxunto da materia.
Na
oportunidade de xullo os estudantes poderán liberarse de facer as probas
correspondentes nas que a súa calificación na
oportunidade de xaneiro fora de alomenos 4 sobre 10.
Na primeira oportunidade (xaneiro-febreiro), so os estudantes que non se
teñan presentado a ningunha das probas avaliables que figuran arriba e que non entregaran o traballo individual obterán a calificación de NON PRESENTADO. En xullo obterán a calificación de NON PRESENTADO os estudantes que non tiveran presentado ao exame final desa data.
Se algún estudante quere facer algunha das probas nun idioma oficial específico (galego ou español), debe avisar ó profesorado alomenos 1 semana antes da correspondente proba.
A realización fraudulenta das probas ou actividades de avaliación, unha vez comprobada, implicará directamente a cualificación de suspenso na convocatoria en que se cometa: o/a estudante será cualificado con “suspenso” (nota numérica 0) na convocatoria correspondente do curso académico, tanto se a comisión da falta se produce na primeira oportunidade como na segunda. Para isto, procederase a modificar a súa cualificación na acta de primeira oportunidade, se fose necesario.
Fontes de información
Bibliografía básica
Efron, B. and Tibshirani, R.J. (1993). An Introduction to the Bootstrap. Chapman and Hall
Davison, A.C. and Hinkley, D.V. (1997). Bootstrap Methods and their Application. Cambridge University Press
Peña Sánchez de Rivera, D. (2000). Estadística: Modelos y Métodos. Alianza Editorial
Cao Abad, R., Francisco Fernández, M., Naya Fernández, S., Presedo Quindimil, M.A., Vázquez Brage, M (2001). Introducción a la Estadística y sus Aplicaciones. Pirámide
Ewens, W.J. and Grant, G.R. (2005). Statistical Methods in Bioinformatics. Springer
Ross, S.M. (1995). Stochastic Processes. Wiley
Bibliografía complementaria
Recomendacións
Materias que se recomenda ter cursado previamente
Materias que se recomenda cursar simultaneamente
Introdución ás bases de datos/614522002
Xenómica/614522006
Fundamentos de bioinformática/614522008
Introdución á programación/614522001
Fundamentos de intelixencia artificial/614522003
Materias que continúan o temario
Estruturas de datos e algoritmia para secuencias biolóxicas/614522013
Procesamento avanzado de secuencias biolóxicas/614522020
Intelixencia computacional para datos de alta dimensionalidade/614522024
Traballo fin de mestrado/614522025
Intelixencia computacional para bioinformática/614522012
Métodos estatísticos avanzados en bioinformática/614522009
Observacións
Segundo se recolle nas distintas normativas de aplicación para a docencia universitaria, deberase incorporar a perspectiva de xénero nesta materia (usarase linguaxe non sexista, utilizarase bibliografía de autores/as de ambos sexos, propiciarase a intervención en clase de alumnos e alumnas, etc.)
Traballarase para identificar e modificar prexuízos e actitudes sexistas e influirase na contorna para modificalos e fomentar valores de respecto e igualdade.
Deberanse detectar situacións de discriminación por razón de xénero e proporanse accións e medidas para corrixilas.
(*)A Guía docente é o documento onde se visualiza a proposta académica
da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do
órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías