Datos Identificativos 2022/23
Asignatura (*) Aprendizaje Estadístico Código 614493125
Titulación
Mestrado Universitario en Técnicas Estadísticas (Plan 2019)
Descriptores Ciclo Periodo Curso Tipo Créditos
Máster Oficial 1º cuatrimestre
Segundo Optativa 5
Idioma
Castellano
Modalidad docente Presencial
Prerrequisitos
Departamento Matemáticas
Coordinador/a
Fernández Casal, Rubén
Correo electrónico
ruben.fcasal@udc.es
Profesorado
Fernández Casal, Rubén
Correo electrónico
ruben.fcasal@udc.es
Web http://rubenfcasal.github.io/aprendizaje_estadistico
Descripción general Nesta materia preténdese achegar ao alumno ao modelado e resolución de problemas de aprendizaxe estatística procedentes de aplicacións reais

Competencias del título
Código Competencias del título
A16 CE1 - Conocer, identificar, modelar, estudiar y resolver problemas complejos de estadística e investigación operativa, en un contexto científico, tecnológico o profesional, surgidos en aplicaciones reales
A17 CE2 - Desarrollar autonomía para la resolución práctica de problemas complejos surgidos en aplicaciones reales y para la interpretación de los resultados de cara a la ayuda en la toma de decisiones.
A18 CE3 - Adquirir conocimientos avanzados de los fundamentos teóricos subyacentes a las distintas metodologías de la estadística y la investigación operativa, que permitan su desarrollo profesional especializado.
A19 CE4 - Adquirir las destrezas necesarias en el manejo teórico-práctico de la teoría de la probabilidad y las variables aleatorias que permitan su desarrollo profesional en el ámbito científico/académico, tecnológico o profesional especializado y multidisciplinar.
A20 CE5 - Profundizar en los conocimientos en los fundamentos teórico-prácticos especializados del modelado y estudio de distintos tipos de relaciones de dependencia entre variables estadísticas.
A21 CE6 - Adquirir conocimientos teórico-prácticos avanzados de distintas técnicas matemáticas, orientadas específicamente a la ayuda en la toma de decisiones, y desarrollar la capacidad de reflexión para evaluar y decidir entre distintas perspectivas en contextos complejos.
A22 CE7 - Adquirir conocimientos teórico-prácticos avanzados de distintas técnicas de optimización matemática, tanto en contextos unipersonales como multipersonales, y saber aplicarlos con autonomía suficiente en un contexto científico, tecnológico o profesional.
A23 CE8 - Adquirir conocimientos teórico-prácticos avanzados de las técnicas destinadas a la realización de inferencias y contrastes relativos a variables y parámetros de un modelo estadístico, y saber aplicarlos con autonomía suficiente un contexto científico, tecnológico o profesional.
A24 CE9 - Conocer y saber aplicar con autonomía en contextos científicos, tecnológicos o profesionales, técnicas de aprendizaje automático y técnicas de análisis de datos de alta dimensión (big data).
A25 CE10 - Adquirir conocimientos avanzados sobre metodologías para la obtención y el tratamiento de datos desde distintas fuentes, como encuestas, internet, o entornos “en la nube".
B1 CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
B2 CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
B3 CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
B4 CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan¿ a públicos especializados y no especializados de un modo claro y sin ambigüedades
B5 CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
B17 CG1 - Conocer, comprender y saber aplicar los principios, metodologías y nuevas tecnologías en la estadística y la investigación operativa en contextos científico/académicos, tecnológicos o profesionales especializados y multidisciplinares, así como adquirir las destrezas y competencias descritas en los objetivos generales del título.
B18 CG2 - Desarrollar autonomía para identificar, modelar y resolver problemas complejos de la estadística y la investigación operativa en contextos científico/académicos, tecnológicos o profesionales especializados y multidisciplinares.
B19 CG3 - Desarrollar la capacidad para realizar estudios y tareas de investigación y transmitir los resultados a públicos especializados, académicos y generalistas.
B20 CG4 - Integrar conocimientos avanzados y enfrentarse a la toma de decisiones a partir de información científica y técnica.
B21 CG5 - Desarrollar la capacidad de aplicación de algoritmos y técnicas de resolución de problemas complejos en el ámbito de la estadística y la investigación operativa, manejando el software especializado adecuado.
C11 CT1 - Desarrollar firmes capacidades de razonamiento, análisis crítico y autocrítico, así como de argumentación y de síntesis, contextos especializados y multidisciplinares.
C12 CT2 - Desarrollar destrezas avanzadas en el manejo de Tecnologías de la Información y la Comunicación (TIC), tanto para la obtención de información como para la difusión del conocimiento, en un ámbito científico/académico, tecnológico o profesional especializado y multidisciplinar.
C13 CT3 - Ser capaz de resolver problemas complejos en entornos nuevos mediante la aplicación integrada de los conocimientos.
C14 CT4 - Desarrollar una sólida capacidad de organización y planificación del estudio, asumiendo la responsabilidad de su propio desarrollo profesional, para la realización de trabajos en equipo y de forma autónoma.
C15 CT5 - Desarrollar capacidades para el aprendizaje y la integración en el trabajo en equipos multidisciplinares, en los ámbitos científico/académico, tecnológico y profesional.

Resultados de aprendizaje
Resultados de aprendizaje Competencias del título
Ser capaz de identificar y modelar problemas complejos de aprendizaje estadístico surgidos en aplicaciones reales AM16
AM17
AM18
AM19
AM20
AM21
AM22
AM23
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Adquirir conocimientos avanzados sobre aprendizaje estadístico tanto supervisado como no supervisado AM16
AM17
AM18
AM19
AM20
AM21
AM22
AM23
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Conocer los principios generales de las nuevas metodologías de aprendizaje supervisado para clasificación y regresión AM16
AM17
AM18
AM19
AM20
AM21
AM22
AM23
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Identificar y adquirir destreza en el uso de las principales herramientas de R de aprendizaje estadístico AM16
AM20
AM24
AM25
BP2
BP3
BP4
BP5
BP20
BP21
CP12
CP13
CP14
CP15
Saber analizar datos utilizando técnicas de Aprendizaje Estadístico en contextos multidisciplinares AM16
AM17
AM18
AM20
AM21
AM24
AM25
BP1
BP2
BP3
BP4
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Ser capaz de aplicar con autonomía los resultados adquiridos en el análisis de datos masivos o de alta dimensión AM16
AM17
AM18
AM20
AM21
AM24
AM25
BP1
BP2
BP3
BP5
BP17
BP18
BP19
BP20
BP21
CP11
CP12
CP13
CP14
CP15
Saber comunicar los resultados propios del Aprendizaje Estadístico a un público especializado o no especializado BP4
BP19
CP11
CP12
CP14
CP15

Contenidos
Tema Subtema
Introducción al aprendizaje estadístico Aprendizaje Estadístico y Aprendizaje Automático. Métodos de Aprendizaje Estadístico: supervisados y no supervisados. Construcción y evaluación de los modelos. La maldición de la dimensionalidad. Análisis e interpretación de los modelos. Paquetes de R.
Métodos de aprendizaje supervisado para clasificación Métodos basados en árboles. Bagging, bosques aleatorios y boosting. Máquinas de soporte vectorial (support vector machines). Otros métodos de clasificación.
Métodos de aprendizaje supervisado para regresión Modelos lineales generalizados y modelos aditivos. Métodos no paramétricos. Selección de variables y métodos de regularización: regresión contraída (ridge) y lasso. Métodos de reducción de la dimensión: componentes principales y mínimos cuadrados parciales. Regresión por projection pursuit. Redes neuronales. Métodos colaborativos.

Planificación
Metodologías / pruebas Competéncias Horas presenciales Horas no presenciales / trabajo autónomo Horas totales
Sesión magistral A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 C15 15 25 40
Prácticas a través de TIC A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 C15 20 51 71
Prueba mixta A16 A17 A24 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 4 0 4
 
Atención personalizada 10 0 10
 
(*)Los datos que aparecen en la tabla de planificación són de carácter orientativo, considerando la heterogeneidad de los alumnos

Metodologías
Metodologías Descripción
Sesión magistral Presentación de los aspectos teóricos relevantes de la materia, de modo que el alumnado pueda abordar la realización de las prácticas a través de TIC. Se fomentará en todo momento la participación y el debate
Prácticas a través de TIC Aplicación práctica de las metodologías explicadas en las sesiones magistrales. Se hará uso de herramientas de software libre, principalmente del entorno estadístico R, y también de recursos web
Prueba mixta El alumno deberá demostrar su dominio de los aspectos teóricos de la materia y su capacidad para la resolución de problemas

Atención personalizada
Metodologías
Prácticas a través de TIC
Sesión magistral
Descripción
Tanto en las sesiones magistrales como en las sesiones prácticas será importante atender personalmente a los alumnos ante las posibles dudas que puedan surgir. Esta atención servirá al profesor para detectar posibles problemas en la metodología empleada para impartir la materia y, además, a los alumnos para consolidar los conocimientos y para expresar sus inquietudes acerca de la asignatura

Evaluación
Metodologías Competéncias Descripción Calificación
Prácticas a través de TIC A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 C15 A lo largo del curso, el alumno demostrará su interés y dominio de la materia, y su capacidad de trabajo en equipo, mediante la realización de trabajos, individuales o en grupo. La calificación obtenida se conservará entre las dos oportunidades de la convocatoria de cada curso
50
Prueba mixta A16 A17 A24 B1 B2 B3 B4 B5 B17 B18 B19 B20 B21 C11 C12 C13 C14 El examen final consistirá en una prueba escrita teórico-práctica
50
 
Observaciones evaluación

En la fecha que establezca el Máster de Técnicas Estadísticas en su programación anual, el alumno realizará, por escrito, el examen final de la materia (prueba mixta), en el que tendrá que responder a preguntas teóricas, resolver cuestiones teórico-prácticas, y calcular la solución de diversos problemas. Para esta prueba el alumno sólo podrá llevar consigo el material que se autorice de forma expresa.

Para aprobar la materia será necesario superar las dos partes (prácticas a través de TIC y prueba mixta). 

La oportunidad de julio (segunda oportunidad) estará sometida a los mismos criterios que la de enero (primera oportunidad). Los alumnos que se presenten a la segunda oportunidad podrán optar entre mantener la nota de prácticas a través de TIC o volver a examinarse también de esta parte.


Fuentes de información
Básica James, G., Witten, D., Hastie, T. y Tibshirani, R. (2017). An Introduction to Statistical Learning: with Aplications in R. Springer
Kuhn, M. y Johnson, K. (2013). Applied predictive modeling. Springer
Fernández-Casal, R. y Costa, J. (2020). Aprendizaje Estadístico. Libro online: https://rubenfcasal.github.io/aprendizaje_estadistico
Williams, G. (2011). Data Mining with Rattle and R. Springer

Complementária Burger, S. V. (2018). Introduction to Machine Learning with R: Rigorous Mathematical Analysis. O’Reilly
Efron, B. y Hastie, T. (2016). Computer Age Statistical Inference. Cambridge University Press
Torgo, L. (2011). Data Mining with R: Learning with Case Studies. Chapman & Hall/CRC Press
Hastie, T., Tibshirani, R. y Wainwright, M. (2015). Statistical Learning with Sparsity: the Lasso and Generalizations. CRC press
Hastie, T., Tibshirani, R. y Friedman, J. (2017). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer


Recomendaciones
Asignaturas que se recomienda haber cursado previamente
Regresión Generalizada y Modelos Mixtos/614493110
Modelos de Regresión/614493105

Asignaturas que se recomienda cursar simultáneamente

Asignaturas que continúan el temario

Otros comentarios
Es recomendable que el alumno posea conocimientos básicos de regresión y de estadística multivariante. Disponer de conocimientos generales del entorno estadístico R facilitará el aprovechamiento de las clases y la realización de las prácticas.

Se aconseja participar activamente en el proceso de aprendizaje de la materia: asistencia y participación a las clases teóricas y prácticas, utilización de horas de tutorías y la realización de un esfuerzo responsable de trabajo y asimilación personal de los métodos estudiados.



(*) La Guía Docente es el documento donde se visualiza la propuesta académica de la UDC. Este documento es público y no se puede modificar, salvo cosas excepcionales bajo la revisión del órgano competente de acuerdo a la normativa vigente que establece el proceso de elaboración de guías