Guía DocenteCurso
Facultade de Informática
  Inicio | galego | castellano | english | A A |  
Grao en Ciencia e Enxeñaría de Datos
 Asignaturas
  Modelización Estatística de Datos de Alta Dimensión
   Contidos
Temas Subtemas
0. Distribucións multidimensionais 0.1 Concepto de distribución multidimensional
0.2. Matriz de varianzas-covarianzas. Transformacións lineais
0.3. Normal multidimensional: definición e propiedades
1. Métodos de redución da dimensión 1.1 Obxectivos da Análise de Compoñentes Principais (ACP)
1.2 Transformacións para conseguir incorrelación
1.3 Obtención das compoñentes principais
1.4 Compoñentes principais e cambios de escala
1.5 Interpretación das compoñentes principais
1.6 Análise factorial
1.7 Escalamento multidimensional
2. Clasificación non supervisada 2.1 Obxectivos da clasificación non supervisada: métodos xerárquicos e non xerárquicos
2.2 Análise clúster: deseño e obxectivos
2.3 Árbore xerárquica ou dendograma
2.4 Similitudes e discrepancias entre observacións
2.5 Criterios para a formación de grupos: encadeamento simple, completo, promedio do grupo, método do centroide, método de Ward
2.6 Métodos non xerárquicos baseados en distancias: veciños máis próximos, k medias, métodos baseados na estimación da densidade
3. Clasificación supervisada
3.1 Obxectivos da clasificación supervisada: regras de clasificación e criterios de erro
3.2 Análise factorial discriminante: deseño, obxectivos e cálculo dos factores discriminantes
3.3 Análise discriminante lineal de Fisher e análise discriminante cadrático
3.4 Regra discriminante de máxima verosimilitude, regra Bayes, regras discriminantes non paramétricas
3.5 Relación cos modelos de regresión con resposta binaria
3.6 Estimación da probabilidade de clasificación incorrecta: validación cruzada e bootstrap
4. Modelos para datos de alta dimensión
4.1 Selección de variables en regresión: contrastes de significación
4.2 O problema dos contrastes múltiples: false discovery rate (FDR) e familywise error rate (FWER)
4.3 Modelos de regresión de coeficientes dispersos: regresión riscal (ridge regression), lasso e as súas variantes
4.4 Selección de variables e modelos con coeficientes dispersos no caso de clasificación
Universidade da Coruña - Rúa Maestranza 9, 15001 A Coruña - Tel. +34 981 16 70 00  Soporte Guías Docentes