Datos Identificativos 2022/23
Asignatura (*) Intelixencia computacional para datos de alta dimensionalidade Código 614522024
Titulación
Mestrado Universitario en Bioinformática para Ciencias da Saúde
Descriptores Ciclo Período Curso Tipo Créditos
Mestrado Oficial 1º cuadrimestre
Segundo Obrigatoria 3
Idioma
Castelán
Galego
Inglés
Modalidade docente Presencial
Prerrequisitos
Departamento Ciencias da Computación e Tecnoloxías da Información
Computación
Coordinación
Eiras Franco, Carlos
Correo electrónico
carlos.eiras.franco@udc.es
Profesorado
Eiras Franco, Carlos
Correo electrónico
carlos.eiras.franco@udc.es
Web http://moodle.udc.es
Descrición xeral Nesta materia traballarase nos fundamentos e aplicación práctica das bases de datos de alta dimensión e na aplicación de técnicas de minería de datos no ámbito da bioinformática

Competencias do título
Código Competencias do título
A2 CE2 - Definir, avaliar e seleccionar a arquitectura e o software máis axeitado para resolver un problema no campo da Bioinformática
A3 CE3 - Analizar , deseñar , desenvolver, implementar , verificar e documentar solucións software eficientes sobre a base dun coñecemento adecuado das teorías, modelos e técnicas actuais no eido da Bioinformática
A4 CE4 - Capacidade para adquirir, obter, formalizar e representar o coñecemento humano nunha forma computable para a resolución de problemas mediante un sistema informático en calquera ámbito de aplicación, particularmente os relacionados con aspectos de computación, percepción e actuación en aplicacións Bioinformáticas
A6 CE6 – Capacidade para identificar as ferramentas software e fontes de datos de bioinformática máis relevantes, e adquirir destreza no seu uso
B1 CB6 – Posuír e comprender o coñecemento que fornecen unha base ou oportunidade de orixinalidade no desenvolvemento e / ou aplicación de ideas, a miúdo nun contexto de investigación.
B2 CB7 - Que os estudantes saiban aplicar os coñecementos adquiridos e a súa capacidade de resolución de problemas en contornas novas ou pouco coñecidas dentro de contextos máis amplos (ou multidisciplinares) relacionados coa súa área de estudo
B3 CB8 – Que os estudantes sexan capaces de integrar coñecementos e xestionar a complexidade de formular xuízos en base a información que, sendo incompleta ou limitada, inclúa reflexións sobre as responsabilidades sociais e éticas relacionadas coa aplicación dos seus coñecementos e xuízos
B6 CG1 - Buscar e seleccionar a información útil necesaria para resolver problemas complexos, manexando con soltura as fontes bibliográficas do campo
B7 CG2 - Manter e estender enfoques teóricos fundados para permitir a introdución i explotación de tecnoloxías novas e avanzadas
C1 CT1 - Expresarse correctamente, tanto de xeito oral como escrito, nas linguas oficiais da comunidade autónoma
C3 CT3 - Utilizar as ferramentas básicas das tecnoloxías da información e as comunicacións (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida
C6 CT6 - Valorar criticamente o coñecemento, a tecnoloxía e a información dispoñibles para resolver os problemas cos que deben enfrontarse

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias do título
Coñecer e comprender os paradigmas e aspectos máis relevantes do tratamento de bases de datos de alta dimensión AP2
AP3
AP4
AP6
BP1
BP2
BP3
BP6
BP7
CP1
CP3
CP6
Coñecer e saber aplicar os principais métodos de minería de datos; coñecer as plataformas e as paradigmas principais que se empregan no campo. AP2
AP3
AP4
AP6
BP1
BP2
BP3
BP6
BP7
CP1
CP3
CP6

Contidos
Temas Subtemas
Introducción ao Big data. Qué é Big Data
Principais características do Big data
Principais campos de aplicación
Minería de datos e alta dimensión Analítica Big data
Técnicas de preprocesado
MapReduce
Modelos de programación Batch Hadoop
Resilient Distributed datasets
Programación batch en Spark
Modelos de programación streaming

Conceptos básicos
Kafka, Apache Storm, Spark streaming

Planificación
Metodoloxías / probas Competencias Horas presenciais Horas non presenciais / traballo autónomo Horas totais
Sesión maxistral A4 C1 C6 12 24 36
Traballos tutelados A2 A3 A4 A6 B3 B6 C1 C3 8 24 32
Proba mixta A2 A3 A4 A6 B1 B2 B3 B6 B7 C1 C3 C6 2 4 6
 
Atención personalizada 1 0 1
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Sesión maxistral Empregada durante as clases presenciais teóricas para expor o núcleo básico de coñecementos que logo os alumnos terán que saber utilizar e ampliar nas prácticas.
Traballos tutelados Elaboración e entrega de traballos aplicados que empreguen as tecnoloxías e técnicas vistas na teoría.
Proba mixta Realizarase ao final do cuadrimestre sobre os contidos tratados ao longo do curso.

Atención personalizada
Metodoloxías
Traballos tutelados
Proba mixta
Sesión maxistral
Descrición
As titorias considéranse unha parte importante dentro do desenvolvemento da asignatura. Están orientadas de tal maneira que os/as estudantes teñan e/ou poidan consultar distintas cuestións como:
1. Posibilidades de desenvolvemento profesional
2. Problemas no desenvolvemento das prácticas
3. Maneiras de enfocar/organizar as prácticas
4. Resolución de dubidas sobre as cuestións teóricas

A resolución de dúbidas e cuestións farase nas horas de clase ou nas horas establecidas como titorías de cada profesor.

Avaliación
Metodoloxías Competencias Descrición Cualificación
Traballos tutelados A2 A3 A4 A6 B3 B6 C1 C3 Nota correspondente á parte práctica da materia que comprende os traballos entregados. 80
Proba mixta A2 A3 A4 A6 B1 B2 B3 B6 B7 C1 C3 C6 Realizarase unha proba con cuestións relativas tanto ás partes teóricas da materia como ós traballos entregados. 20
 
Observacións avaliación
O alumno deberá obter unha nota mínima de 4 sobre 10 puntos na proba obxectiva e unha nota mínima de 4 sobre 10 nos traballos tutelados. Se non se acada esta nota mínima nalgún dos dous ditos apartados, a nota da materia será a menor das dúas. Satisfeito este requisito, deberáse acadar unha nota de 5 ou superior no global da asignatura para superala.

Un/unha estudante considerarase presentado/a nunha convocatoria se fai a entrega dalgún dos traballos tutelados ou se se presenta á proba obxectiva.
 
O traballo entregado deberá ser orixinal do alumno. De acordo ao artigo 14, apartado 4, da normativa*, a entrega de traballos non orixinais ou con partes duplicadas (sexa por copias entre compañeiros ou por obtención doutras fontes...) levará unha nota global de SUSPENSO na convocatoria correspondente, tanto para o/a estudante que presente material copiado como a quen o facilitase.

* Normativa de avaliación, revisión e reclamación das cualificacións dos estudos de grao e máster universitario, aprobada polo Consello de Goberno da Universidade da Coruña o 19 de decembro de 2013.

Sobre a responsabilidade compartida dos traballos en grupo. 
Nas actividades que se levan a cabo en grupos, tales como os traballos tutelados, todos os membros do grupo serán responsables solidarios do traballo realizado e entregado, así como das consecuencias que se deriven do incumprimento das normas de autoría do mesmo. 

Segunda oportunidade e convocatorias posteriores
Na segunda oportunidade, mantense á nota acadada nos traballos tutelados. Os alumnos que se presenten a esta segunda oportunidade deberán realizar a proba mixta. Opcionalmente, e só no caso de non ter presentado os traballos tutelados na primeira oportunidade ou de teren obtido estes a calificación de SUSPENSO (calificación menor que 5), poderánse presentar de novo os traballos tutelados na segunda oportunidade.

No caso de suspender la asignatura, os traballos tutelados con nota igual ou superior a 5 poderanse gardar para o curso posterior con calificación de aprobado (5) se o alumno/a así o desexa. Para cada traballo, o alumno terá a opción de entregar unha nova práctica que sustituiría a nota da anterior. Os traballos non se gardarán máis de un curso.

Matrícula con dispensa académica
No caso dos alumnos con matrícula con dispensa académica os traballos tutelados deberán entregarse nas datas establecidas. É responsabilidade destes/as estudantes poñer en coñecimento do profesor a súa circunstancia.

Fontes de información
Bibliografía básica Venkat Ankam (2016.). Big Data Analytics. Packt Publishing
Thilina Gunarathne (2015). Hadoop MapReduce v2 Cookbook. Packt Publishing
Tom White (2015). Hadoop: The Definitive Guide. O'Reilly Media
Vladimir Bacvanski. (2015). Introduction to Big Data An Overview of Fundamental Big Data Concepts, Tools, Techniques and Practices.. O'Reilly Media
Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia (2015). Learning Spark. O'Reilly Media
Sean T. Allen, Matthew Jankowski, and Peter Pathirana (2015). Storm Applied. . O'Reilly Media

Bibliografía complementaria


Recomendacións
Materias que se recomenda ter cursado previamente
Intelixencia computacional para bioinformática/614522012
Métodos estatísticos avanzados en bioinformática/614522009
Computación de altas prestacións en bioinformática/614522011
Introdución á programación/614522001
Fundamentos de intelixencia artificial/614522003

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario

Observacións


(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías