Datos Identificativos 2019/20
Asignatura (*) Intelixencia computacional para datos de alta dimensionalidad Código 614522024
Titulación
Descriptores Ciclo Período Curso Tipo Créditos
Mestrado Oficial 1º cuadrimestre
Segundo Obrigatoria 3
Idioma
Castelán
Inglés
Modalidade docente Presencial
Prerrequisitos
Departamento Ciencias da Computación e Tecnoloxías da Información
Computación
Coordinación
Bolón Canedo, Verónica
Correo electrónico
veronica.bolon@udc.es
Profesorado
Bolón Canedo, Verónica
Morán Fernández, Laura
Correo electrónico
veronica.bolon@udc.es
laura.moranf@udc.es
Web http://moodle.udc.es
Descrición xeral Nesta materia traballarase nos fundamentos e aplicación práctica das bases de datos de alta dimensión e na aplicación de técnicas de minería de datos no ámbito da bioinformática

Competencias do título
Código Competencias do título

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias do título
Coñecer e comprender os paradigmas e aspectos máis relevantes do tratamento de bases de datos de alta dimensión AP2
AP3
AP4
AP6
BP1
BP2
BP3
BP6
BP7
CP1
CP3
CP6
Coñecer e saber aplicar os principais métodos de minería de datos; coñecer as plataformas e as paradigmas principais que se empregan no campo. AP2
AP3
AP4
AP6
BP1
BP2
BP3
BP6
BP7
CP1
CP3
CP6

Contidos
Temas Subtemas
Introducción ao Big data. Qué é Big Data
Principais características do Big data
Principais campos de aplicación
Minería de datos e alta dimensión Analítica Big data
Técnicas de preprocesado
MapReduce
Modelos de programación Batch Hadoop
Resilient Distributed datasets
Programación batch en Spark
Modelos de programación streaming

Conceptos básicos
Kafka, Apache Storm, Spark streaming

Planificación
Metodoloxías / probas Competencias Horas presenciais Horas non presenciais / traballo autónomo Horas totais
Sesión maxistral A4 C1 C6 7 14 21
Solución de problemas A25 A33 A41 B1 B6 C3 8 16 24
Traballos tutelados A21 B3 B6 C1 C2 C3 C6 4 4 8
Seminario A21 B1 B3 B6 4 4 8
Proba mixta A2 A3 A4 A6 B1 B2 B3 B6 B7 C1 C3 C6 4 10 14
 
Atención personalizada 0 0 0
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Sesión maxistral Empregada durante as clases presenciais teóricas para expor o núcleo básico de coñecementos que logo os alumnos terán que saber utilizar e ampliar nas prácticas, seminarios e traballos do curso
Solución de problemas Emprego de técnicas de minería de datos en alta dimensión.
Uso de paradigmas Big data
Realización dunha práctica nunha plataforma específica de Big data
Traballos tutelados Entrega dun breve traballo que discutirase na clase sobre algún aspecto concreto da materia.
Seminario Exposición dun traballo específico de investigación que involucre tecnoloxías de alta dimensionalidade
Proba mixta Realizarase ao final do cuadrimestre sobre os contidos tratados ao longo do curso.

Atención personalizada
Metodoloxías
Seminario
Solución de problemas
Traballos tutelados
Proba mixta
Sesión maxistral
Descrición
No esquema de carácter práctico utilizado nesta materia, as tutorías resultan un recurso fundamental moi empregado polos alumnos, sobre todo debido á complexidade dalgúns conceptos da materia, en función das titulacións de entrada dos diferentes alumnos.

Os alumnos poden realizar dous tipos de tutorías: virtuais e presenciais. As primeiras poden utilizalas para dúbidas moi concretas de resposta rápida. As máis comúns iranse depositando nun apartado de %"Preguntas Frecuentes" que deberán consultar antes de enviar unha nova pregunta.
.

Avaliación
Metodoloxías Competencias Descrición Cualificación
Seminario A21 B1 B3 B6 Seminarios de temas específicos 0
Traballos tutelados A21 B3 B6 C1 C2 C3 C6 Nota correspondente á parte práctica da materia, que comprende tanto os desenvolvementos realizados sobre as plataformas, como os traballos entregados. 50
Proba mixta A2 A3 A4 A6 B1 B2 B3 B6 B7 C1 C3 C6 Realizarase unha proba con cuestións relativas ás partes teóricas da materia 50
Sesión maxistral A4 C1 C6 Clases presenciais 0
 
Observacións avaliación

Fontes de información
Bibliografía básica Venkat Ankam (2016.). Big Data Analytics. Packt Publishing
Thilina Gunarathne (2015). Hadoop MapReduce v2 Cookbook. Packt Publishing
Tom White (2015). Hadoop: The Definitive Guide. O'Reilly Media
Vladimir Bacvanski. (2015). Introduction to Big Data An Overview of Fundamental Big Data Concepts, Tools, Techniques and Practices.. O'Reilly Media
Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia (2015). Learning Spark. O'Reilly Media
Sean T. Allen, Matthew Jankowski, and Peter Pathirana (2015). Storm Applied. . O'Reilly Media

Bibliografía complementaria


Recomendacións
Materias que se recomenda ter cursado previamente
Intelixencia computacional para bioinformática/614522012
Métodos estatísticos avanzados en bioinformática/614522009
Computación de altas prestacións en bioinformática/614522011
Introdución á programación/614522001
Fundamentos de intelixencia artificial/614522003

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario

Observacións


(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías