Competencias do título |
Código
|
Competencias / Resultados do título
|
A1 |
CE1 - Definir, avaliar e seleccionar a arquitectura e o software máis axeitado para a resolución dun problema |
A2 |
CE2 - Analizar e mellorar o rendimento dunha arquitectura ou un software dado |
B1 |
CB6 - Posuir e comprender coñecementos que aporten unha base ou oportunidade de ser orixinais no desenrolo e/ou aplicación de ideas, a miudo nun contexto de investigación |
B2 |
CB7 - Que os estudantes saiban aplicar os coñecementos adquiridos e súa capacidade de resolución de problemas en contornas novas ou pouco coñecidas dentro de contextos máis amplos (ou multidisciplinares) relacionados coa súa área de estudo |
B6 |
CG1 - Ser capaz de buscar e seleccionar a información útil necesaria para resolver problemas complexos, manexando con soltura as fontes bibliográficas do campo |
B8 |
CG3 - Ser capaz de manter e extender plantexamentos teóricos fundados para permitir a introducción e explotación de tecnoloxías novas e avanzadas no campo |
B10 |
CG5 - Ser capaz de traballar en equipo, especialmente de carácter multidisciplinar, e ser hábiles na xestión do tempo, persoas e toma de decisións. |
C1 |
CT1 -Utilizar as ferramentas básicas das tecnoloxías da información e as comunicacións (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida. |
C4 |
CT4 - Valorar a importancia que ten a investigación, a innovación e o desenrolo tecnolóxico no avance socioeconómico e cultural da sociedade |
Resultados de aprendizaxe |
Resultados de aprendizaxe |
Competencias / Resultados do título |
O alumno será capaz de seleccionar, instalar, configurar e xestionar o software básico para o procesamento de datos masivos.
|
AP1 AP2
|
BP2 BP6 BP8 BP10
|
CP1
|
O alumno será capaz de implementar códigos nalgunha linguaxe especializada no procesamento de datos masivos. |
AP2
|
BP1 BP2 BP10
|
CP1
|
O alumno coñecerá e aprenderá a utilizar algunhas das ferramentas dispoñibles para Data Engineering (en particular, par Inxesta/Almacenamento/Procesado/Visualización). |
AP1 AP2
|
BP1 BP2
|
CP1 CP4
|
O alumno adquirirá a habilidade necesaria para a procura, selección e manexo de recursos (bibliografía, software, etc.) relacionados con Big Data. |
AP1 AP2
|
BP1 BP6
|
CP1 CP4
|
Contidos |
Temas |
Subtemas |
Bajar 1. Introducción a Data Engineering |
1.1 HPC vs Big Data: similitudes y diferencias en el tratamiento de datos
1.2 Tecnologías Hardware y Software para High Performance Data Engineering
1.3 Data Engineering en infraestructuras HPC vs entornos Cloud |
2 Etapas de Data Engineering |
2.1 Modelado (Formatos, Compresión, Diseño de Esquemas)
2.2 Ingesta (Periodicidad, Transformaciones, Herramientas)
2.3 Almacenamiento (HDFS y BBDD NoSQL, HBase, MongoDB, Cassandra)
2.4 Procesado (Batch, Real-Time)
2.5 Orquestación
2.6 Análisis (SQL, Machine Learning, Graphs, UI)
2.7 Gobernanza
2.8 Integración con BI (Visualización) |
3 Introducción a Analítica de Datos |
3.1 Exploratory Data Analytics
3.2 Introducción a Machine Learning |
4 Casos de Uso |
4.1 Aplicaciones en Internet de las Cosas (entornos Smart e Industria 4.0)
4.2 Aplicaciones en ciencias e ingeniería |
Planificación |
Metodoloxías / probas |
Competencias / Resultados |
Horas lectivas (presenciais e virtuais) |
Horas traballo autónomo |
Horas totais |
Sesión maxistral |
A2 A1 B1 C4 |
18 |
0 |
18 |
Prácticas de laboratorio |
B1 B8 B10 |
20 |
60 |
80 |
Traballos tutelados |
A1 A2 B1 B2 B8 |
0 |
45 |
45 |
Discusión dirixida |
B6 C1 C4 |
4 |
3 |
7 |
|
Atención personalizada |
|
0 |
|
0 |
|
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado |
Metodoloxías |
Metodoloxías |
Descrición |
Sesión maxistral |
Impartidas por los profesores de la asignatura. Incluyen exposición de material teórico, así como de seminarios. |
Prácticas de laboratorio |
Resolución de problemas y casos prácticos. |
Traballos tutelados |
Realización de prácticas de mayor entidad de forma semiautónoma, guiados por los profesores de la asignatura. |
Discusión dirixida |
Orientación para la realización de los trabajos individuales o en grupo, resolución de dudas y actividades de evaluación continua. |
Atención personalizada |
Metodoloxías
|
Discusión dirixida |
Prácticas de laboratorio |
Traballos tutelados |
|
Descrición |
Durante as prácticas de laboratorio, traballos tutelados, e discusións dirixidas, os estudantes poderán presentar preguntas, dúbidas, etc. O profesor, atendendo ás súas solicitudes, repasará conceptos, resolverá novos problemas ou utilizará calquera actividade que considere adecuada para resolver as cuestions expostas. |
|
Avaliación |
Metodoloxías
|
Competencias / Resultados |
Descrición
|
Cualificación
|
Discusión dirixida |
B6 C1 C4 |
Seguimiento continuo y objetivable de una participación activa. |
10 |
Prácticas de laboratorio |
B1 B8 B10 |
Evaluación de las prácticas llevadas a cabo por los estudiantes. |
40 |
Traballos tutelados |
A1 A2 B1 B2 B8 |
Evaluación de los trabajos tutelados desarrollados por los estudiantes. |
50 |
|
Observacións avaliación |
Primeira oportunidade (ordinaria - maio): Realización de prácticas: 40% Traballos academicamente dirixidos: 50% Seguimento continuo e objetivable dunha participación activa: 10% Segunda oportunidade (extraordinaria - xullo): Realización de prácticas: o alumno conservará a nota obtida neste apartado na convocatoria ordinaria, xa que para a convocatoria extraordinaria non se planifican novas actividades. 40% da nota final. Avaliación de traballos academicamente dirixidos: será preciso presentar os traballos academicamente dirixidos que non se presentaron na convocatoria ordinaria e volveranse a presentar, tras as modificacións oportunas indicadas polos profesores, aqueles que non recibisen unha cualificación mínima necesaria para aprobar na devandita convocatoria. 50% da nota final. Seguimento continuo e objetivable dunha participación activa: o alumno conservará a nota obtida neste apartado na convocatoria ordinaria, xa que para a convocatoria extraordinaria non se planifican novas actividades. 10% da nota final. Non presentado: Considerarase non presentado ao alumno que non entregue ningunha práctica nin traballo academicamente dirixido.
|
Fontes de información |
Bibliografía básica
|
Tom White (2015). Hadoop: The Definitive Guide. O'Reilly (4ª ed.)
Wes McKinney (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly (2ª ed.) |
|
Bibliografía complementaria
|
Alex Holmes (2014). Hadoop in practice. Manning (2ª ed.) |
|
Recomendacións |
Materias que se recomenda ter cursado previamente |
|
Materias que se recomenda cursar simultaneamente |
|
Materias que continúan o temario |
|
Observacións |
Recomendacionens para o estudo da materia Debido ao forte compoñente práctico é recomendable ir facendo as actividades prácticas e traballos academicamente dirixidos de forma regular ao longo do cuadrimestre. O coñecemento do inglés tanto falado como escrito é imprescindible dado que a bibliografía e as conferencias externas poden desenvolverse en inglés. Observacións Farase un uso intensivo de ferramentas de comunicación online: videoconferencia, chat, etc. As sesións presenciais serán gravadas para ou revisión posterior. Ademais, farase uso da ferramenta Aula CESGA para a distribución de contidos, creación de foros de discusión, etc... As ferramentas software utilizadas nesta materia son de fontes abertas. |
|