Identifying Data 2019/20
Subject (*) Resampling Techniques Code 614493022
Study programme
Mestrado Universitario en Técnicas Estadísticas (Plan 2019)
Descriptors Cycle Period Year Type Credits
Official Master's Degree 1st four-month period
First Second Optional 5
Teaching method Face-to-face
Department Matemáticas
General description Pretendese que o alumno adquira destreza na identificación de situacións nas que os métodos de remostraxe son ferramentas inferenciais axeitadas para resolver problemas reais. Para iso tratarase de que o alumno coñeza o funcionamento das principais técnicas de remostraxe, entre as que se destaca o método bootstrap, así como as súas aplicacións nos principais ámbitos da estatística. Asimesmo perseguese que o alumno sexa quen de deseñar e implementar en ordenador plans de remostraxe axeitados para un amplo abano de situacións.

Study programme competencies
Code Study programme competences / results
A2 Capacidade para comprender, formular, formular e resolver aqueles problemas susceptibles de ser abordados a través de modelos da estatística e da investigación operativa.
A4 Coñecer algoritmos de resolución dos problemas e manexar o software axeitado.
A9 Obter os coñecementos precisos para unha análise crítica e rigorosa dos resultados.
B6 Capacidade para iniciar a investigación e para participar en proxectos de investigación que poden culminar na elaboración dunha tese doutoral.
B8 Capacidade de traballo en equipo e de forma autónoma
B10 Capacidade de identificar e resolver problemas
C1 Ser capaz de identificar un problema da vida real.
C2 Dominar a terminoloxía científica-metodolóxica para comprender e interactuar con outros profesionais.
C3 Habilidade para traballar os aspectos metodolóxicos da investigación en colaboración con outros colegas a través do Campus Virtual co foro.
C4 Habilidade para realizar a análise estatística con ordenador.
C5 Escoller o deseño máis axeitado para responder á pregunta de investigación.
C6 Utilizar as técnicas estatísticas máis axeitadas para analizar os datos dunha investigación.
C7 Planificar, analizar e interpretar os resultados dunha investigación considerando tanto os aspectos teóricos coma os metodolóxicos.
C8 Habilidade de xestión administrativa do proceso dunha investigación.
C9 Comunicación e difusión dos resultados das investigacións.
C10 Lectura con xuízo crítico de artigos científicos dende unha perspectiva metodolóxica.

Learning aims
Learning outcomes Study programme competences / results
G1 - Capacidade para iniciar a investigación e para participar en proxectos de investigación que poden culminar na elabouración duhna teses de doutoramento. AC2
G2 - Capacidade de aplicación de algoritmos de resolución dos problemas e manexo do software adecuado. AC4
G3 - Capacidade de traballo en equipo e de xeito autónomo BJ8
G4 - Capacidade de formular problemas en termos estatísticos, e de resolvelos utilizando as técnicas axeitadas. AC2
G6 - Capacidade de identificar e resolver problemas BJ10
G10 - Capacidade de integrarse nun equipo multidisciplinar para a análise experimental BJ8
G11 - Adquirir destreza para o desenvolvemento de software AC2
G12 - Capacidade de análise estatística crítica das mostras, os plantexamentos e resultados AC2
G14 - Representar un problema real mediante un modelizado estatístico axeitado. AC2
G15 - Deseñar un plano de observación ou recollida de datos que permita abordar o problema de interese AC4
E2 - A adquisición dos coñecementos de estatística e investigación de operacións necesarios para a incorporación en equipos multidisciplinares pertencentes a diferentes sectores profesionais. AC2
E4 - Coñecer as aplicacións dos modelos da estatística e a investigación de operacións. AC2
E5 - Coñecer algoritmos de resolución dos problemas e manexar o software axeitado. AC4
E12 - Realizar inferencias respecto aos parámetros que aparecen no modelo. CJ6
E19 - Tratamento de datos e análise estatística dos resultados obtidos. BJ6
E27 - Obter os coñecementos precisos para unha análise crítica e rigurosa dos resultados. AC9
E28 - Complementar a aprendizaxe dos aspectos metodolóxicos con apoio de software. AC4
E78 - Fomentar a sensibilidade cara os principios do pensamento científico, favorecendo as actitudes asociadas ao desenvovemento dos métodos matemáticos, como: o cuestionamento das ideas intuitivas, a análise crítica das afirmacións, a capacidade de análise e síntese ou a toma de decisións racionais AC2
E82 - O estudiante será capaz de comprender a importancia da Inferencia Estatística como ferramenta de obtención de información sobre a población en estudo, a partir do conxunto de datos observados dunha mostra representativa de esta. Para iso deberá recoñecer a diferenza entre estatística paramétrica e non paramétrica. CJ4
E84 - Ser quen de manexar diverso software (en particular R) e interpretar os resultados que proporcionan nos correspondentes estudos prácticos. AC4
E86 - Soltura no manexo da teoría da probabilidade e as variables aleatorias. AC2

Topic Sub-topic
1. Motivation of the Bootstrap principle. Uniform bootstrap. Bootstrap distribution calculation: exact distribution and Monte Carlo approximation. Examples.
2. Some applications of the Bootstrap method. Application of the Bootstrap to estimate the precision and the bias of an estimator. Examples.
3. Motivation of the Jackknife method. Jackknife estimation of the precision and the bias of an estimator. Bootstrap/Jackknife relationship. Examples. Simulation studies.
4. Variations of the uniform Bootstrap. Parametric Bootstrap, symmetrized Bootstrap, smoothed Bootstrap, weighted Bootstrap and biased Bootstrap. Discussion and examples. Validity of the Bootstrap approach. Examples.
5. Applications of Bootstrap to construct confidence intervals. Percentile method, percentile-t method, symmetrized percentile-t method . Examples. Simulation studies.
6. Bootstrap and nonparametric density estimation. Bootstrap approximation for the distribution of the Parzen-Rosenblatt estimator. The Bootstrap in the selection of the smoothing parameter.
7. Bootstrap and nonparametric estimation of the regression function. Bootstrap approximation of the distribution of the Nadaraya-Watson estimator. Different resampling methods and results.
8. Bootstrap with censored data. Introduction to censored data. Bootstrap resampling plans in the presence of censorship. Relations among them.
9. Bootstrap with dependent data. Introduction to the usual conditions of dependency and dependent data models. Parametric models of dependence. General dependence situations: Moving Block Bootstrap, Stationary Bootstrap and Subsampling method.

Methodologies / tests Competencies / Results Teaching hours (in-person & virtual) Student’s personal work hours Total hours
Oral presentation A2 A4 A9 B6 B10 C2 C3 C5 C6 C10 21 31.5 52.5
ICT practicals A4 B8 C3 C4 C6 C8 14 28 42
Multiple-choice questions A4 A9 B10 C2 C3 C5 C6 C7 C10 1 11.5 12.5
Problem solving A4 A9 B8 B10 C1 C4 C5 C6 C7 C8 C9 C10 4 8 12
Personalized attention 6 0 6
(*)The information in the planning table is for guidance only and does not take into account the heterogeneity of the students.

Methodologies Description
Oral presentation Presentation with computer by videoconference to three campuses
ICT practicals Resampling algorithm implementation
Multiple-choice questions Multiple-choice test on concepts.
Problem solving Design of resampling plans. Bias and variance calculation for the bootstrap analogues.

Personalized attention
ICT practicals
Problem solving
Attendance and participation in lectures.
Written multiple choice test.
Participation in workshops and seminars.
Practicals to be performed by the student.

Methodologies Competencies / Results Description Qualification
ICT practicals A4 B8 C3 C4 C6 C8 Using the software R to implement the bootstrap method in some setup.
Problem solving A4 A9 B8 B10 C1 C4 C5 C6 C7 C8 C9 C10 Original work on the bootstrap on some relevant setup. 40
Multiple-choice questions A4 A9 B10 C2 C3 C5 C6 C7 C10 Comprehension Test. 40
Assessment comments

The assessment will be carried out using a written test on R labs, an individual student work, as well as a written concept test. The concept test score will be 40% of the total qualification, the test on R labs will correspond to 20% of the global score, while the remaining 40% will correspond to the individual student work, that has to be presented orally.

To pass the subject is necessary to obtain a score of at least 5 out of 10 overall.

On July opportunity, students could avoid those tests with scores of at least 4 out of 10 in January tests.

Only students that didn't take any test will be qualified as NON ATTENDANT in the first opportunity (January-February). In July opportunity only students that didn't take the final exam will be qualified as NON ATTENDANT.

Subjects that it is recommended to have taken before
Estatística Matemática/614468102
Modelos de Probabilidade/614468103
Estatística Aplicada/614468104
Modelos de Regresión/614468105
Análise Exploratoria de Datos (data mining)/614468106
Estatística non Paramétrica/614468109
Simulación Estatística/614468113

Subjects that are recommended to be taken simultaneously
Series de Tempo/614427111
Fiabilidade e Modelos Biométricos/614427116

Subjects that continue the syllabus
Contrastes de Especificación/614468123
Datos Funcionais/614468124
Proxecto Fin de Carreira ou Traballo Tutelado/614468128

(*)The teaching guide is the document in which the URV publishes the information about all its courses. It is a public document and cannot be modified. Only in exceptional cases can it be revised by the competent agent or duly revised so that it is in line with current legislation.