Competencias / Resultados do título |
Código
|
Competencias / Resultados do título
|
Resultados de aprendizaxe |
Resultados de aprendizaxe |
Competencias / Resultados do título |
O alumno será capaz de seleccionar, instalar, configurar e xestionar o software básico para o procesamento de datos masivos. |
AP1 AP2
|
BP2 BP6 BP8 BP10
|
CP1
|
O alumno será capaz de implementar códigos nalgunha linguaxe especializada no procesamento de datos masivos. |
AP2
|
BP1 BP2 BP10
|
CP1
|
O alumno coñecerá e aprenderá a utilizar algunhas das ferramentas dispoñibles para Data Engineering (en particular, para Inxesta/Almacenamento/Procesado/Visualización). |
AP1 AP2
|
BP1 BP2
|
CP1 CP4
|
O alumno adquirirá a habilidade necesaria para a procura, selección e manexo de recursos (bibliografía, software, etc.) relacionados con Big Data.
|
AP1 AP2
|
BP1 BP6
|
CP1 CP4
|
Contidos |
Temas |
Subtemas |
1. Introducción a Data Engineering |
1.1 HPC vs Big Data: similitudes e diferencias no tratamento de datos
1.2 Tecnoloxías Hardware e Software para High Performance Data Engineering
1.3 Data Engineering en infraestructuras HPC vs entornos Cloud |
2. Introducción a Analítica de Datos |
2.1 Exploratory Data Analytics
2.2 Introducción a Machine Learning |
3. Etapas de Data Engineering |
3.1 Modelado (Formatos, Compresión, Deseño de Esquemas)
3.2 Inxesta (Periodicidade, Transformaciones, Ferramentas)
3.3 Almacenamento (HDFS y BBDD NoSQL, HBase, MongoDB, Cassandra)
3.4 Procesado (Batch, Real-Time)
3.5 Orquestación
3.6 Análise (SQL, Machine Learning, Graphs, UI)
3.7 Gobernanza
3.8 Integración con BI (Visualización) |
4. Casos de Uso |
4.1 Aplicacións en Internet das Cosas (entornos Smart e Industria 4.0)
4.2 Aplicacións en ciencias e enxeñaría |
Planificación |
Metodoloxías / probas |
Competencias / Resultados |
Horas lectivas (presenciais e virtuais) |
Horas traballo autónomo |
Horas totais |
Lecturas |
A1 A2 B1 B6 C4 |
0 |
18 |
18 |
Prácticas de laboratorio |
B1 B8 B10 |
0 |
80 |
80 |
Traballos tutelados |
A1 A2 B1 B2 B8 |
0 |
45 |
45 |
Discusión dirixida |
B6 C1 C4 |
4 |
2 |
6 |
|
Atención personalizada |
|
1 |
0 |
1 |
|
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado |
Metodoloxías |
Metodoloxías |
Descrición |
Lecturas |
Instrucción programada a través de materiais docentes. |
Prácticas de laboratorio |
Resolución de problemas e casos prácticos. |
Traballos tutelados |
Realización de prácticas de mayor entidade de forma semiautónoma, guiados polos profesores da asignatura. |
Discusión dirixida |
Orientación para a realización dos traballos individuais ou en grupo, resolución de dúbidas e actividades de avaliación continua. |
Atención personalizada |
Metodoloxías
|
Prácticas de laboratorio |
Traballos tutelados |
Discusión dirixida |
|
Descrición |
Durante as prácticas de laboratorio, traballos tutelados, e discusións dirixidas, os estudantes poderán presentar preguntas, dúbidas, etc. O profesor, atendendo ás súas solicitudes, repasará conceptos, resolverá novos problemas ou utilizará calquera actividade que considere adecuada para resolver as cuestions expostas. |
|
Avaliación |
Metodoloxías
|
Competencias / Resultados |
Descrición
|
Cualificación
|
Prácticas de laboratorio |
B1 B8 B10 |
Evaluación de las prácticas llevadas a cabo por los estudiantes. |
50 |
Traballos tutelados |
A1 A2 B1 B2 B8 |
Evaluación de los trabajos tutelados desarrollados por los estudiantes. |
50 |
|
Observacións avaliación |
Non presentado: Considerarase non presentado @ alumn@ que non entregue ningunha práctica nin traballo academicamente dirixido. Segunda oportunidade (extraordinaria - xuño/xullo): Volver a realizar aquelas prácticas e traballos tutelados que non se entregaran ou versións melloradas dos xa entregados. Todos os aspectos relacionados con “dispensa académica”, “dedicación ao estudo”, “permanencia” e “fraude académica” rexeranse de acordo coa normativa académica vixente da UDC.
|
Fontes de información |
Bibliografía básica
|
Tom White (2015). Hadoop: The Definitive Guide. O'Reilly (4ª ed.)
Wes McKinney (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly (2ª ed.) |
|
Bibliografía complementaria
|
Alex Holmes (2014). Hadoop in practice. Manning (2ª ed.) |
|
Recomendacións |
Materias que se recomenda ter cursado previamente |
|
Materias que se recomenda cursar simultaneamente |
|
Materias que continúan o temario |
|
Observacións |
Recomendacións para o estudo da materia Debido ao forte compoñente práctico é recomendable ir facendo as actividades prácticas e traballos academicamente dirixidos de forma regular ao longo do cuadrimestre. O coñecemento do inglés tanto falado como escrito é imprescindible dado que a bibliografía e as conferencias externas poden desenvolverse en inglés. Observacións Farase un uso intensivo de ferramentas de comunicación online: videoconferencia, chat, etc. As sesións presenciais serán gravadas para ou revisión posterior. Ademais, farase uso da ferramenta Aula CESGA para a distribución de contidos, creación de foros de discusión, etc... As ferramentas software utilizadas nesta materia son xeralmente open-source ou teñen licencia gratuita para estudantes. Perspectiva
de xénero -Segundo
se recolle nas distintas normativas de aplicación para a docencia universitaria
incorporase a perspectiva de xénero nesta materia (usarase linguaxe non
sexista, utilizarase bibliografía de autores/as de ambos sexos, propiciarase a
intervención en clase de alumnos e alumnas...) -Traballarase
para identificar e modificar prexuízos e actitudes sexistas e influirase na
contorna para modificalos e fomentar valores de respecto e igualdade. -Deberanse
detectar situacións de discriminación por razón de xénero e proporanse accións
e medidas para corrixilas. |
|