Datos Identificativos 2022/23
Asignatura (*) Técnicas de Simulación y Remuestreo Código 614G02036
Titulación
Grao en Ciencia e Enxeñaría de Datos
Descriptores Ciclo Periodo Curso Tipo Créditos
Grado 1º cuatrimestre
Cuarto Optativa 6
Idioma
Castellano
Modalidad docente Presencial
Prerrequisitos
Departamento Matemáticas
Coordinador/a
Costa Bouzas, Julian
Correo electrónico
julian.costa@udc.es
Profesorado
Costa Bouzas, Julian
Fernández Casal, Rubén
Correo electrónico
julian.costa@udc.es
ruben.fcasal@udc.es
Web
Descripción general En esta asignatura se estudian algunas de las técnicas más importantes de simulación y de remuestreo, con el objetivo de que el alumno sea capaz de identificar situaciones donde resulten de utilidad y aplicarlas correctamente. Asimismo también se provee al alumno de las bases metodológicas para llevar a cabo experimentos de simulación que permitan validar empíricamente el correcto comportamiento de un algoritmo de análisis de datos, así como la comparación entre algoritmos alternativos.

Competencias del título
Código Competencias del título
A3 CE3 - Capacidad para el análisis de datos y la comprensión, modelado y resolución de problemas en contextos de aleatoriedad.
A17 CE17 - Capacidad para la construcción, validación y aplicación de un modelo estocástico de un sistema real a partir de los datos observados y el análisis crítico de los resultados obtenidos.
A20 CE20 - Conocimiento de las herramientas informáticas en el campo del análisis de los datos y modelización estadística, y capacidad para seleccionar las más adecuadas para la resolución de problemas.
B2 CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio
B3 CB3 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética
B4 CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado
B7 CG2 - Elaborar adecuadamente y con cierta originalidad composiciones escritas o argumentos motivados, redactar planes, proyectos de trabajo, artículos científicos y formular hipótesis razonables.
B8 CG3 - Ser capaz de mantener y extender planteamientos teóricos fundados para permitir la introducción y explotación de tecnologías nuevas y avanzadas en el campo.
B9 CG4 - Capacidad para abordar con éxito todas las etapas de un proyecto de análisis de datos: exploración previa de los datos, preprocesado, análisis, visualización y comunicación de resultados.
B10 CG5 - Ser capaz de trabajar en equipo, especialmente de carácter multidisciplinar, y ser hábiles en la gestión del tiempo, personas y toma de decisiones.
C1 CT1 - Utilizar las herramientas básicas de las tecnologías de la información y las comunicaciones (TIC) necesarias para el ejercicio de su profesión y para el aprendizaje a lo largo de su vida.
C4 CT4 - Valorar la importancia que tiene la investigación, la innovación y el desarrollo tecnológico en el avance socioeconómico y cultural de la sociedad.

Resultados de aprendizaje
Resultados de aprendizaje Competencias del título
Conocer las principales técnicas de simulación estadística A3
A17
A20
B2
B3
B4
B7
B8
B9
B10
C1
C4
Conocer los principios del método de remuestreo bootstrap A3
A17
A20
B2
B3
B4
B7
B8
B9
B10
C1
C4
Saber aplicar las técnicas bootstrap en problemas de regresión y con datos dependientes A3
A17
A20
B2
B3
B4
B7
B8
B9
B10
C1
C4
Ser capaz de aplicar las principales técnicas de simulación para obtener datos simulados, así como aplicar las principales técnicas de remuestreo a conjuntos de datos reales o simulados A3
A17
A20
B2
B3
B4
B7
B8
B9
B10
C1
C4

Contenidos
Tema Subtema
1. Introducción a la simulación 1.1 Conceptos básicos
1.2 Ventajas e inconvenientes de la simulación
1.3 Tipos de números aleatorios
1.4 Números aleatorios en R
2. Generación de números pseudoaleatorios 2.1 Generadores congruenciales y extensiones
2.2 Análisis de la calidad de un generador
2.3 Análisis de resultados de simulación
3. Métodos de simulación de distribuciones 3.1 Simulación de variables aleatorias continuas
3.2 Simulación de variables aleatorias discretas
3.3 Simulación de distribuciones multivariantes
4. Aplicaciones de la simulación 4.1 Estudios de simulación
4.2 Integración y optimización Monte Carlo
4.3 Aplicaciones en inferencia estadística
5. Métodos de remuestreo 5.1 Introducción al remuestreo
5.2 Bootstrap uniforme
5.3 Modificaciones del bootstrap uniforme
5.4 Herramientas disponibles en R
6. Aplicaciones del remuestreo 6.1 Estimación del sesgo y la precisión de un estimador
6.2 Intervalos de confianza bootstrap
6.3 Contrastes de hipótesis bootstrap
6.4 Inferencia en modelos de regresión
6.5 Bootstrap con datos dependientes

Planificación
Metodologías / pruebas Competéncias Horas presenciales Horas no presenciales / trabajo autónomo Horas totales
Sesión magistral A17 A20 A3 B2 B3 B4 B7 B8 B9 B10 C1 C4 21 21 42
Prácticas a través de TIC A17 A20 A3 B2 B3 B4 B7 B8 B9 B10 C1 C4 21 77 98
Prueba mixta A17 A20 A3 B2 B3 B4 B7 B8 B9 C1 4 0 4
 
Atención personalizada 6 0 6
 
(*)Los datos que aparecen en la tabla de planificación són de carácter orientativo, considerando la heterogeneidad de los alumnos

Metodologías
Metodologías Descripción
Sesión magistral Presentación de los aspectos teóricos relevantes de la materia, de modo que el alumnado pueda abordar la realización de las prácticas a través de TIC. Se fomentará en todo momento la participación y el debate
Prácticas a través de TIC Aplicación práctica de las metodologías explicadas en las sesiones magistrales. Se hará uso de herramientas de software libre, principalmente R, y también de recursos web
Prueba mixta El alumnado deberá demostrar su dominio de los aspectos teóricos de la materia y su capacidad para la resolución de problemas

Atención personalizada
Metodologías
Sesión magistral
Prácticas a través de TIC
Descripción
Tanto en las sesiones magistrales como en las prácticas, será importante atender personalmente a los alumnos ante cualquier duda que pueda surgir. Esta atención servirá al profesor para detectar posibles problemas en la metodología utilizada para impartir la materia y, además, a los alumnos para consolidar los conocimientos y expresar sus inquietudes sobre la materia

Evaluación
Metodologías Competéncias Descripción Calificación
Prácticas a través de TIC A17 A20 A3 B2 B3 B4 B7 B8 B9 B10 C1 C4 A lo largo del curso, el alumno demostrará su interés y dominio de la materia, y su capacidad de trabajo en equipo, mediante la realización de trabajos, individuales o en grupo. La calificación obtenida se mantendrá entre las dos oportunidades de la convocatoria de cada curso 40
Prueba mixta A17 A20 A3 B2 B3 B4 B7 B8 B9 C1 El examen final consistirá en una prueba escrita teórico-práctica 60
 
Observaciones evaluación

En la fecha establecida por la Facultad de Informática en su programación anual, el alumno realizará, por escrito, el examen final de la materia (prueba mixta), en el que deberá responder preguntas teóricas, resolver cuestiones teórico-prácticas, y calcular la solución de diversos problemas. Para esta prueba el alumno sólo podrá llevar consigo el material que se autorice de forma expresa.

Para aprobar la materia será necesario superar las dos partes (prácticas a través de TIC prueba mixta).

La oportunidad de julio (segunda oportunidad) estará sometida a los mismos criterios que la oportunidad de enero (primera oportunidad). Los alumnos que se presenten a la segunda oportunidad podrán optar entre mantener la nota de prácticas a través de TIC o volver a examinarse también de esta parte.

No se considera necesario realizar ninguna adaptación para los alumnos a tiempo parcial o con dispensa académica.

La realización fraudulenta de las pruebas o actividades de evaluación implicará directamente la calificación de suspenso (0) en la materia en la oportunidad correspondiente.


Fuentes de información
Básica Chernick, M.R. y LaBudde, R.A. (2014). An introduction to bootstrap methods with applications to R. John Wiley & Sons
Davison, A.C. y Hinkley, D.V. (1997). Bootstrap Methods and their Application. Cambridge University Press
Cao, R. (2002). Introducción a la simulación y a la teoría de colas. NetBiblo
Robert, C.P. y Casella, G. (2010). Introducing Monte Carlo Methods with R. Springer
Jones, O. et al. (2009). Introduction to Scientific Programming and Simulation Using R. CRC
Fernández-Casal, R. y Cao, R. (2022). Simulación Estadística. Libro online: https://rubenfcasal.github.io/simbook
Cao R. y Fernández-Casal R. (2021). Técnicas de Remuestreo. Libro online: https://rubenfcasal.github.io/book_remuestreo

Complementária Efron, B. y Tibshirani, R.J. (1993). An Introduction to the Bootstrap. Chapman and Hall
Fox, J. y Weisberg, S. (2018). An R companion to applied regression. Sage
Suess, E.A. y Trumbo, B.E. (2010). Introduction to probability simulation and Gibbs sampling with R. Springer
Gentle, J.E. (2003). Random number generation and Monte Carlo methods. Springer?Verlag
Ross, S.M. (1999). Simulation. Prentice Hall
Ripley, B.D. (1987). Stochastic Simulation. John Wiley & Sons
Shao, J. y Tu, D. (1995). The Jackknife and Bootstrap. Springer-Verlag


Recomendaciones
Asignaturas que se recomienda haber cursado previamente
Modelos de Regresión/614G02012
Inferencia Estadística/614G02007
Probabilidad y Estadística Básica/614G02003

Asignaturas que se recomienda cursar simultáneamente

Asignaturas que continúan el temario

Otros comentarios


(*) La Guía Docente es el documento donde se visualiza la propuesta académica de la UDC. Este documento es público y no se puede modificar, salvo cosas excepcionales bajo la revisión del órgano competente de acuerdo a la normativa vigente que establece el proceso de elaboración de guías