Datos Identificativos 2022/23
Asignatura (*) Análise Estatística de Datos con Dependencia Código 614G02022
Titulación
Grao en Ciencia e Enxeñaría de Datos
Descriptores Ciclo Período Curso Tipo Créditos
Grao 1º cuadrimestre
Terceiro Obrigatoria 6
Idioma
Castelán
Modalidade docente Presencial
Prerrequisitos
Departamento Matemáticas
Coordinación
Aneiros Perez, German
Correo electrónico
german.aneiros@udc.es
Profesorado
Aneiros Perez, German
Fernández Casal, Rubén
Correo electrónico
german.aneiros@udc.es
ruben.fcasal@udc.es
Web
Descrición xeral Modelización de datos que presentan dependencia temporal e/ou espacial. Utilizaranse modelos estatísticos paramétricos. A partir de devanditos modelos, obteranse predicións de valores en novos instantes temporais ou posicións espaciais. Farase uso do software R.

Competencias do título
Código Competencias do título
A17 CE17 - Capacidade para a construción, validación e aplicación dun modelo estocástico dun sistema real a partir dos datos observados e a análise crítica dos resultados obtidos.
A19 CE19 - Capacidade para comprender, expor, formular e resolver problemas susceptibles de ser abordados a través de modelos estatísticos para datos que presentan dependencia.
A20 CE20 - Coñecemento das ferramentas informáticas no campo da análise dos datos e modelización estatística, e capacidade para seleccionar as máis adecuadas para a resolución de problemas.
B2 CB2 - Que os estudantes saiban aplicar os seus coñecementos ao seu traballo ou vocación dunha forma profesional e posúan as competencias que adoitan demostrarse por medio da elaboración e defensa de argumentos e a resolución de problemas dentro da súa área de estudo
B3 CB3 - Que os estudantes teñan a capacidade de reunir e interpretar datos relevantes (normalmente dentro da súa área de estudo) para emitir xuízos que inclúan unha reflexión sobre temas relevantes de índole social, científica ou ética
B4 CB4 - Que os estudantes poidan transmitir información, ideas, problemas e solucións a un público tanto especializado como non especializado
B7 CG2 - Elaborar adecuadamente e con certa orixinalidade composicións escritas ou argumentos motivados, redactar plans, proxectos de traballo, artigos científicos e formular hipóteses razoables.
B8 CG3 - Ser capaz de manter e estender formulacións teóricas fundadas para permitir a introdución e explotación de tecnoloxías novas e avanzadas no campo.
B9 CG4 - Capacidade para abordar con éxito todas as etapas dun proxecto de datos: exploración previa dos datos, preprocesado, análise, visualización e comunicación de resultados.
B10 CG5 - Ser capaz de traballar en equipo, especialmente de carácter multidisciplinar, e ser hábiles na xestión do tempo, persoas e toma de decisións.
C1 CT1 - Utilizar as ferramentas básicas das tecnoloxías da información e as comunicacións (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida.
C4 CT4 - Valorar a importancia que ten a investigación, a innovación e o desenvolvemento tecnolóxico no avance socioeconómico e cultural da sociedade.

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias do título
Coñecer e comprender conceptos xerais relativos a procesos estocásticos. A17
A19
B4
B8
Identificar e analizar modelos estatísticos susceptibles de xerar a un conxunto de datos dependentes. A17
A19
B2
B4
B9
B10
C4
Coñecer e aplicar técnicas de estimación dos parámetros presentes nos modelos estatísticos con datos dependentes. A17
A19
B2
B4
B9
B10
C4
Entender a importancia de levar a cabo unha diagnose dun modelo construído con datos que presenten dependencia temporal e/ou espacial. A17
A19
B4
C4
Coñecer e aplicar os fundamentos da predición en series de tempo. A17
A19
B2
B4
B7
B9
B10
C4
Ser capaz de interpretar os modelos propostos e os resultados obtidos ao utilizar técnicas estatísticas para datos dependentes. B3
B4
B7
B9
B10
C4
Saber manexar con soltura programas informáticos avanzados de análise estatística. A20
C1

Contidos
Temas Subtemas
1. Análise descritiva dunha serie de tempo 1.1 Introdución
1.2 Descomposición dunha serie de tempo
2. Series de tempo e procesos estocásticos 2.1 Introdución
2.2 Procesos estocásticos: concepto e definicións asociadas
3. Metodoloxía Box- Jenkins
3.1 Introdución
3.2 Modelización ARIMA e predición
4. Tópicos adicionais
Introducción a análise de intervención, valores atípicos, regresión con series de tempo, e cluster e clasificación con series de tempo
5. Estatística Espacial 5.1 Tipos de procesos espaciais
5.2 Análise exploratorio de datos espaciais
5.3 Modelado de procesos xeoestatísticos
5.4 Predición Kriging
5.5 Introdución á Estatística espazo-temporal

Planificación
Metodoloxías / probas Competencias Horas presenciais Horas non presenciais / traballo autónomo Horas totais
Sesión maxistral A17 A19 B3 B4 B8 B9 C4 21 42 63
Prácticas a través de TIC A20 B2 B4 B7 B9 B10 C1 C4 14 42 56
Seminario B7 B8 C4 7 14 21
Proba mixta A17 A19 B2 B3 B8 B9 C4 2 0 2
 
Atención personalizada 8 0 8
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Sesión maxistral O profesor, coa axuda dos medios audiovisuais pertinentes, expoñerá os contidos teórico-prácticos da materia. O material empregado estará ao dispor dos estudantes.
Prácticas a través de TIC Trátase de poñer en práctica a metodoloxía estatística aprendida nas sesións maxistrais. Farase uso do software R (gratuíto).

Faránselle chegar ao estudante distintos conxuntos de datos reais para ser analizados ao longo das sesións de prácticas. Á súa vez, recomendaráselle que obteña outros datos pola súa conta para que reforce a súa destreza na análise de datos con dependencia, esta vez nas horas dedicadas ao traballo autónomo.
Seminario O seu obxectivo é apontoar, a través da realización de exercicios teórico-prácticos, a comprensión dos contidos expostos nas sesións maxistrais. Nalgunhas ocasións, poderían dedicarse a completar as prácticas a través de TIC.

Faránselle chegar ao estudante distintos exercicios para que trate de resolvelos (algúns deles ao longo do propio seminario e outros nas horas dedicadas ao traballo autónomo).
Proba mixta Proba tipo test a través da cal se avaliará o grao de aprendizaxe alcanzada polo estudante.

Atención personalizada
Metodoloxías
Sesión maxistral
Prácticas a través de TIC
Seminario
Descrición
Ao longo de calquera das actividades nas que o profesor estea presente (sesión maxistral, prácticas a través de TIC, seminario), o estudante ten a oportunidade de expoñerlle as dúbidas que lle xurdan acerca dos contidos que se están impartindo ou levando á práctica. Se a resolución das devanditas dúbidas implica unha clara perda de continuidade da actividade que se está levando a cabo, ou ben se as dúbidas xórdenlle ao estudante en horas non presenciais, pode facer uso das titorías individualizadas para que lle sexan resoltas por parte do profesor.

Avaliación
Metodoloxías Competencias Descrición Cualificación
Proba mixta A17 A19 B2 B3 B8 B9 C4 Consistirá nunha proba tipo test de coñecementos teórico-prácticos, que será realizada na data oficial aprobada pola Xunta de Facultade. 60
Prácticas a través de TIC A20 B2 B4 B7 B9 B10 C1 C4 Parte do grao de aprendizaxe alcanzada nas prácticas a través de TIC avaliarase de maneira continua. Para iso, realizaranse unha ou dúas probas ao longo do curso (no horario establecido para ditas prácticas) e/ou un ou dous traballos (individuais ou en grupo). A súa resolución requirirá do uso do software R e tamén do coñecemento da metodoloxía estatística explicada nas sesións maxistrais. 40
 
Observacións avaliación

Primeira oportunidade: Si se denotan a través de P e F as notas (sobre 10) obtidas nas "Prácticas a través de TIC" e na "Proba mixta", respectivamente, a nota final será: 

    (a) 0.4*P+0.6*F, sempre e cando tanto P como F sexan maiores ou iguais que 3.

    (b) 4.5*(0.4*P+0.6*F)/7.2, sempre e cuando P e/ou F sexan menores que 3.

Como consecuencia do anterior, tense que para superar a materia será necesario obter un mínimo de 3 puntos tanto nas "Prácticas a través de TIC" como na "Proba mixta".

Avisarase da data en que se realizará cada proba práctica cunha antelación mínima de 7 días. Os traballos prácticos terán un prazo de entrega de polo menos 7 días. 


 Segunda oportunidade: A puntuación obtida nas "Prácticas a través de TIC" na primera oportunidade manterase para esta segunda oportunidade si é superior ou igual a 5. Si é menor que 5, o alumno terá a opción de volver a facer a(s) proba(s)/traballo(s) correspondente(s) a a(s) parte(s) de prácticas non superada(s); si non fai uso de dita opción, manteráselle a nota da primeira oportunidade. Todos os alumnos deben realizar a "Proba mixta". A nota final obterase da mesma forma que na primera oportunidade.

Fontes de información
Bibliografía básica Bivand R.S., Pebesma E.J., Gómez-Rubio V. (2008). Applied Spatial Data Analysis with R. Springer
Hyndman R.J., Athanasopoulos G. (2018). Forecasting: Principles and Practice. O Texts (2ª edición) (accesible online en https://otexts.com/fpp2/)
Cowpertwait P.S.P., Metcalfe A.V. (2009). Introductory Time Series with R. Springer
Diggle P., Ribeiro P.J. (2007). Model-based Geostatistics. Springer
Cryer J.D., Chan K-S. (2008). Time Series Analysis. With Applications in R. Springer (2ª edición)
Montero P., Vilar J.A. (2014). TSclust: An R package for time series clustering. Journal of Statistical Software 62(1)

Bibliografía complementaria Peña D. (2005). Análisis de Series Temporales. Alianza Editorial
Liao T.W. (2005). Clustering of time series-a survey. Pattern Recognittion 38, 1857-1874
Chilès J.P., Delfiner P. (1999). Geostatistics: modeling spatial uncertainty. Wiley
Brockwell P.J., Davis R.A. (2002). Introduction to Time Series and Forecasting. Springer (2ª edición)
Wikle C.K., Zammit-Mangion A., Cressie N. (2019). Spatio-temporal Statistics with R. Chapman and Hall/CRC (accesible online en https://spacetimewithr.org)
Shumway R.H., Stoffer D.S. (2017). Time Series Analysis and Its Applications. With R Examples. Springer (4ª edición)


Recomendacións
Materias que se recomenda ter cursado previamente
Modelos de Regresión/614G02012
Modelización Estatística de Datos de Alta Dimensión/614G02013
Inferencia Estatística/614G02007
Probabilidade e Estatística Básica/614G02003

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario
Técnicas de Simulación e Remostraxe/614G02036
Análise Estatística de Datos Complexos/614G02031

Observacións


(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías