Datos Identificativos 2024/25
Asignatura (*) Análise de Datos con HPC Código 614973108
Titulación
Descriptores Ciclo Período Curso Tipo Créditos
Mestrado Oficial 2º cuadrimestre
Primeiro Optativa 6
Idioma
Inglés
Modalidade docente Non presencial
Prerrequisitos
Departamento Departamento profesorado máster
Enxeñaría de Computadores
Coordinación
López Taboada, Guillermo
Correo electrónico
guillermo.lopez.taboada@udc.es
Profesorado
López Taboada, Guillermo
Rodríguez Álvarez, Gabriel
Correo electrónico
guillermo.lopez.taboada@udc.es
gabriel.rodriguez@udc.es
Web http://aula.cesga.es
Descrición xeral A cantidade cada vez maior de información accesible a través de Internet fai que o procesamento eficiente de grandes cantidades de datos sexa cada vez de maior interese. Isto levou ao desenvolvemento de novas técnicas de almacenamento e procesamento de inxentes cantidades de información, denominadas técnicas Big Data, que se adaptan de forma natural aos sistemas distribuídos.

Competencias / Resultados do título
Código Competencias / Resultados do título

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias / Resultados do título
O alumno será capaz de seleccionar, instalar, configurar e xestionar o software básico para o procesamento de datos masivos. AP1
AP2
BP2
BP6
BP8
BP10
CP1
O alumno será capaz de implementar códigos nalgunha linguaxe especializada no procesamento de datos masivos. AP2
BP1
BP2
BP10
CP1
O alumno coñecerá e aprenderá a utilizar algunhas das ferramentas dispoñibles para Data Engineering (en particular, para Inxesta/Almacenamento/Procesado/Visualización). AP1
AP2
BP1
BP2
CP1
CP4
O alumno adquirirá a habilidade necesaria para a procura, selección e manexo de recursos (bibliografía, software, etc.) relacionados con Big Data. AP1
AP2
BP1
BP6
CP1
CP4

Contidos
Temas Subtemas
1. Introducción a Data Engineering 1.1 HPC vs Big Data: similitudes e diferencias no tratamento de datos
1.2 Tecnoloxías Hardware e Software para High Performance Data Engineering
1.3 Data Engineering en infraestructuras HPC vs entornos Cloud
2. Introducción a Analítica de Datos 2.1 Exploratory Data Analytics
2.2 Introducción a Machine Learning
3. Etapas de Data Engineering 3.1 Modelado (Formatos, Compresión, Deseño de Esquemas)
3.2 Inxesta (Periodicidade, Transformaciones, Ferramentas)
3.3 Almacenamento (HDFS y BBDD NoSQL, HBase, MongoDB, Cassandra)
3.4 Procesado (Batch, Real-Time)
3.5 Orquestación
3.6 Análise (SQL, Machine Learning, Graphs, UI)
3.7 Gobernanza
3.8 Integración con BI (Visualización)
4. Casos de Uso 4.1 Aplicacións en Internet das Cosas (entornos Smart e Industria 4.0)
4.2 Aplicacións en ciencias e enxeñaría

Planificación
Metodoloxías / probas Competencias / Resultados Horas lectivas (presenciais e virtuais) Horas traballo autónomo Horas totais
Lecturas A1 A2 B1 B6 C4 0 18 18
Prácticas de laboratorio B1 B8 B10 0 80 80
Traballos tutelados A1 A2 B1 B2 B8 0 45 45
Discusión dirixida B6 C1 C4 4 2 6
 
Atención personalizada 1 0 1
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Lecturas Instrucción programada a través de materiais docentes.
Prácticas de laboratorio Resolución de problemas e casos prácticos.
Traballos tutelados Realización de prácticas de mayor entidade de forma semiautónoma, guiados polos profesores da asignatura.
Discusión dirixida Orientación para a realización dos traballos individuais ou en grupo, resolución de dúbidas e actividades de avaliación continua.

Atención personalizada
Metodoloxías
Prácticas de laboratorio
Traballos tutelados
Discusión dirixida
Descrición
Durante as prácticas de laboratorio, traballos tutelados, e discusións dirixidas, os estudantes poderán presentar preguntas, dúbidas, etc. O profesor, atendendo ás súas solicitudes, repasará conceptos, resolverá novos problemas ou utilizará calquera actividade que considere adecuada para resolver as cuestions expostas.

Avaliación
Metodoloxías Competencias / Resultados Descrición Cualificación
Prácticas de laboratorio B1 B8 B10 Evaluación de las prácticas llevadas a cabo por los estudiantes. 50
Traballos tutelados A1 A2 B1 B2 B8 Evaluación de los trabajos tutelados desarrollados por los estudiantes. 50
 
Observacións avaliación

Non presentado: Considerarase non presentado @ alumn@ que non entregue ningunha práctica nin traballo academicamente dirixido.

Segunda oportunidade (extraordinaria - xuño/xullo): Volver a realizar aquelas prácticas e traballos tutelados que non se entregaran ou versións melloradas dos xa entregados.

Todos os aspectos relacionados con “dispensa académica”, “dedicación ao estudo”, “permanencia” e “fraude académica” rexeranse de acordo coa normativa académica vixente da UDC.


Fontes de información
Bibliografía básica Tom White (2015). Hadoop: The Definitive Guide. O'Reilly (4ª ed.)
Wes McKinney (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly (2ª ed.)

Bibliografía complementaria Alex Holmes (2014). Hadoop in practice. Manning (2ª ed.)


Recomendacións
Materias que se recomenda ter cursado previamente

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario

Observacións

Recomendacións para o estudo da materia

Debido ao forte compoñente práctico é recomendable ir facendo as actividades prácticas e traballos academicamente dirixidos de forma regular ao longo do cuadrimestre.

O coñecemento do inglés tanto falado como escrito é imprescindible dado que a bibliografía e as conferencias externas poden desenvolverse en inglés.

Observacións

Farase un uso intensivo de ferramentas de comunicación online: videoconferencia, chat, etc. As sesións presenciais serán gravadas para ou revisión posterior. Ademais, farase uso da ferramenta Aula CESGA para a distribución de contidos, creación de foros de discusión, etc...

As ferramentas software utilizadas nesta materia son xeralmente open-source ou teñen licencia gratuita para estudantes.

Perspectiva de xénero

-Segundo se recolle nas distintas normativas de aplicación para a docencia universitaria incorporase a perspectiva de xénero nesta materia (usarase linguaxe non sexista, utilizarase bibliografía de autores/as de ambos sexos, propiciarase a intervención en clase de alumnos e alumnas...)

-Traballarase para identificar e modificar prexuízos e actitudes sexistas e influirase na contorna para modificalos e fomentar valores de respecto e igualdade.

-Deberanse detectar situacións de discriminación por razón de xénero e proporanse accións e medidas para corrixilas.



(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías