Datos Identificativos 2022/23
Asignatura (*) Aprendizaxe Estatístico Código 614493125
Titulación
Mestrado Universitario en Técnicas Estadísticas (Plan 2019)
Descriptores Ciclo Período Curso Tipo Créditos
Mestrado Oficial 1º cuadrimestre
Segundo Optativa 5
Idioma
Castelán
Modalidade docente Presencial
Prerrequisitos
Departamento Matemáticas
Coordinación
Fernández Casal, Rubén
Correo electrónico
ruben.fcasal@udc.es
Profesorado
Fernández Casal, Rubén
Correo electrónico
ruben.fcasal@udc.es
Web http://rubenfcasal.github.io/aprendizaje_estadistico
Descrición xeral Nesta materia preténdese achegar ao alumno ao modelado e resolución de problemas de aprendizaxe estatística procedentes de aplicacións reais

Competencias do título
Código Competencias do título
A16 CE1 - Coñecer, identificar, modelar, estudar e resolver problemas complexos de estatística e investigación operativa, nun contexto científico, tecnolóxico ou profesional, xurdidos en aplicacións reais.
A17 CE2 – Desenvolver autonomía para a resolución práctica de problemas complexos surdidos en aplicación reais e para a interpretación dos resultados cara á axuda na toma de decisións.
A18 CE3 - Adquirir coñecementos avanzados dos fundamentos teóricos subxacentes ás distintas metodoloxías da estatística e a investigación operativa, que permitan o seu desenvolvemento profesional especializado.
A19 CE4 - Adquirir as destrezas necesarias no manexo teórico-práctico da teoría de probabilidade e as variables aleatorias que permitan o seu desenvolvemento profesional no eido científico/académico, tecnolóxico ou profesional especializado e multidisciplinar.
A20 CE5 - Profundizar no coñecemento dos fundamentos teórico-prácticos especializados de modelado e estudo de distintos tipos de relacións de dependencia entre variables estatísticas.
A21 CE6 - Adquirir coñecementos teórico-prácticos avanzados de distintas técnicas matemáticas, orientadas específicamente á axuda na toma de decisións, e desenvolver a capacidade de reflexión para avaliar e decidir entre distintas perspectivas en contextos complexos.
A22 CE7 - Adquirir coñecementos teórico-prácticos avanzados de distintas técnicas de optimización matemática, tanto en contextos unipersoais como multipersoais, e saber aplicalos con autonomía suficiente nun contexto científico, tecnolóxico ou profesional.
A23 CE8 - Adquirir coñecementos teórico-prácticos avanzados das técnicas destinadas á realización de inferencias e contrastes relativos a variables e parámetros dun modelo estatístico, e saber aplicalos con autonomía suficiente nun contexto científico, tecnolóxico ou profesional.
A24 CE9 - Coñecer e saber aplicar con autonomía en contextos científicos, tecnolóxicos ou profesionais, técnicas de aprendizaxe automático e técnicas de análise de datos de alta dimensión (big data).
A25 CE10 - Adquirir coñecementos avanzados sobre metodoloxías para a obtención e o tratamento de datos derivados de distintas fuentes, como enquisas, internet, ou entornos “na nube".
B1 CB6 - Posuír e comprender coñecementos que acheguen unha base ou oportunidade de ser orixinais no desenvolvemento e/ou aplicación de ideas, a miúdo nun contexto de investigación
B2 CB7 - Que os estudantes saiban aplicar os coñecementos adquiridos e a súa capacidade de resolución de problemas en ámbitos novos ou pouco coñecidos dentro de contextos máis amplos (ou multidisciplinares) relacionados coa súa área de estudo
B3 CB8 - Que os estudantes sexan capaces de integrar coñecementos e enfrontarse á complexidade de formular xuízos a partir dunha información que, sendo incompleta ou limitada, inclúa reflexións sobre as responsabilidades sociais e éticas vinculadas á aplicación dos seus coñecementos e xuízos
B4 CB9 - Que os estudantes saiban comunicar as súas conclusións e os coñecementos e razóns últimas que as sustentan a públicos especializados e non especializados dun modo claro e sen ambigüidades
B5 CB10 - Que os estudantes posúan as habilidades de aprendizaxe que lles permitan continuar estudando dun modo que haberá de ser en gran medida autodirixido ou autónomo.
B17 CG1 - Coñecer, comprender e saber aplicar os principios, metodoloxías e novas tecnoloxías na estatística e a investigación operativa en contextos científico/académicos, tecnolóxicos ou profesionais especializados e multidisciplinares, así como adquirir as destrezas e competencias descritas nos objectivos generales do título.
B18 CG2 - Desenvolver autonomía para identificar, modelar e resolver problemas complexos da estatística e da investigación operativa en contextos científico/académicos, tecnolóxicos ou profesionais especializados e multidisciplinares.
B19 CG3 - Desenvolver a capacidade para realizar estudos e tarefas de investigación e transmitir os resultados a públicos especializados, académicos e xeneralistas.
B20 CG4 - Integrar coñecementos avanzados e enfrontarse á toma de decisións a partir de información científica e técnica.
B21 CG5 - Desenvolver a capacidade de aplicación de algoritmos e técnicas de resolución de problemas complexos no eido da estatística e a investigación operativa, manexando o software especializado axeitado.
C11 CT1 - Desenvolver firmes capacidades de razoamento, análise crítica e autocrítica, así como de argumentación e de síntese, contextos especializados e multidisciplinais.
C12 CT2 - Desenvolver destrezas avanzadas no manexo de Tecnoloxías da Información e a Comunicación (TIC), tanto para a obtención de información como para a difusión do coñecemento, nun ámbito científico/académico, tecnolóxico ou profesional especializado e multidisciplinar.
C13 CT3 - Ser capaz de resolver problemas complexos en novos escenarios mediante a aplicación integrada dos coñecementos.
C14 CT4 - Desenvolver unha sólida capacidade de organización e planificación do estudo, asumindo a responsabilidade do seu propio desenvovemento profesional, para a realización de traballos en equipo e de xeito autónomo.
C15 CT5 - Desenvolver capacidades para o aprendizaxe e a integración no traballo en equipos multidisciplinais, nos ámbitos científico/académico, tecnolóxico e profesional.

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias do título
Ser capaz de identificar e modelar problemas complexos de aprendizaxe estatística xurdidos en aplicacións reais AM16
AM17
AM18
AM19
AM20
AM21
AM22
AM23
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Adquirir coñecementos avanzados sobre aprendizaxe estatística tanto supervisado como non supervisado AM16
AM17
AM18
AM19
AM20
AM21
AM22
AM23
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Coñecer os principios xerais das novas metodoloxías de aprendizaxe supervisada para clasificación e regresión AM16
AM17
AM18
AM19
AM20
AM21
AM22
AM23
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Identificar e adquirir destreza no uso das principais ferramentas de R de aprendizaxe estatística AM16
AM20
AM24
AM25
BP2
BP3
BP4
BP5
BP20
BP21
CP12
CP13
CP14
CP15
Saber analizar datos utilizando técnicas de Aprendizaxe Estatística en contextos multidisciplinares AM16
AM17
AM18
AM20
AM21
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Ser capaz de aplicar con autonomía os resultados adquiridos na análise de datos masivos ou de alta dimensión AM16
AM17
AM18
AM20
AM21
AM24
AM25
BP1
BP2
BP3
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Saber comunicar os resultados propios da Aprendizaxe Estatística a un público especializado ou non especializado BP4
BP19
CP11
CP12
CP14
CP15

Contidos
Temas Subtemas
Introdución á aprendizaxe estatística Aprendizaxe estatística e aprendizaxe automática. Métodos de aprendizaxe estatística: supervisados e non supervisados. Construción e avaliación dos modelos. A maldición da dimensionalidade. Análise e interpretación dos modelos. Paquetes de R.
Métodos de aprendizaxe supervisada para clasificación Métodos baseados en árbores. Bagging, bosques aleatorios e boosting. Máquinas de soporte vectorial (support vector machines). Outros métodos de clasificación.
Métodos de aprendizaxe supervisada para regresión Modelos lineais xeneralizados e modelos aditivos. Métodos non paramétricos. Selección de variables e métodos de regularización: regresión contraída (ridge) e lasso. Métodos de redución da dimensión: compoñentes principais e mínimos cadrados parciais. Regresión por projection pursuit. Redes neuronais. Métodos colaborativos.

Planificación
Metodoloxías / probas Competencias Horas presenciais Horas non presenciais / traballo autónomo Horas totais
Sesión maxistral A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 C15 15 25 40
Prácticas a través de TIC A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 C15 20 51 71
Proba mixta A16 A17 A24 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 4 0 4
 
Atención personalizada 10 0 10
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Sesión maxistral Presentación dos aspectos teóricos relevantes da materia, de modo que o alumnado poida abordar a realización das prácticas a través de TIC. Fomentarase en todo momento a participación e o debate
Prácticas a través de TIC Aplicación práctica das metodoloxías explicadas nas sesións maxistrais. Farase uso de ferramentas de software libre, principalmente da contorna estatística R, e tamén de recursos web
Proba mixta O alumno deberá demostrar o seu dominio dos aspectos teóricos da materia e a súa capacidade para a resolución de problemas

Atención personalizada
Metodoloxías
Prácticas a través de TIC
Sesión maxistral
Descrición
Tanto nas sesións maxistrais como nas sesións prácticas será importante atender persoalmente aos alumnos ante as posibles dúbidas que poidan xurdir. Esta atención servirá ao profesor para detectar posibles problemas na metodoloxía empregada para impartir a materia e, ademais, aos alumnos para consolidar os coñecementos e para expresar as súas inquietudes acerca da materia

Avaliación
Metodoloxías Competencias Descrición Cualificación
Prácticas a través de TIC A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 C15 Ao longo do curso, o alumno demostrará o seu interese e dominio da materia, e a súa capacidade de traballo en equipo, mediante a realización de traballos, individuais ou en grupo. A cualificación obtida conservarase entre as dúas oportunidades da convocatoria de cada curso 50
Proba mixta A16 A17 A24 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 O exame final consistirá nunha proba escrita teórico-práctica 50
 
Observacións avaliación
Na data que estableza o Máster de Técnicas Estatísticas na súa programación anual, o alumno realizará, por escrito, o exame final da materia (proba mixta), no que terá que responder a preguntas teóricas, resolver cuestións teórico-prácticas, e calcular a solución de diversos problemas. Para esta proba o alumno só poderá levar consigo o material que se autorice de forma expresa.

Para aprobar a materia será necesario superar as dúas partes (prácticas a través de TIC e proba mixta). 

A oportunidade de xullo (segunda oportunidade) estará sometida aos mesmos criterios que a de xaneiro (primeira oportunidade). Os alumnos que se presenten á segunda oportunidade poderán optar entre manter a nota de prácticas a través de TIC ou volver examinarse tamén desta parte.


Fontes de información
Bibliografía básica James, G., Witten, D., Hastie, T. y Tibshirani, R. (2017). An Introduction to Statistical Learning: with Aplications in R. Springer
Kuhn, M. y Johnson, K. (2013). Applied predictive modeling. Springer
Fernández-Casal, R. y Costa, J. (2020). Aprendizaje Estadístico. Libro online: https://rubenfcasal.github.io/aprendizaje_estadistico
Williams, G. (2011). Data Mining with Rattle and R. Springer

Bibliografía complementaria Burger, S. V. (2018). Introduction to Machine Learning with R: Rigorous Mathematical Analysis. O’Reilly
Efron, B. y Hastie, T. (2016). Computer Age Statistical Inference. Cambridge University Press
Torgo, L. (2011). Data Mining with R: Learning with Case Studies. Chapman & Hall/CRC Press
Hastie, T., Tibshirani, R. y Wainwright, M. (2015). Statistical Learning with Sparsity: the Lasso and Generalizations. CRC press
Hastie, T., Tibshirani, R. y Friedman, J. (2017). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer


Recomendacións
Materias que se recomenda ter cursado previamente
Regresión Xeneralizada e Modelos Mixtos/614493110
Modelos de Regresión/614493105

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario

Observacións
É recomendable que o alumno posúa coñecementos básicos de regresión e de estatística  multivariante. Dispoñer de coñecementos xerais da contorna estatística  R facilitará o aproveitamento das clases e a realización das prácticas.

Aconséllase participar activamente no proceso de aprendizaxe da materia: asistencia e participación ás clases teóricas e prácticas, utilización de horas de titorías e a realización dun esforzo responsable de traballo e asimilación persoal dos métodos estudados.



(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías