Competencias del título |
Código
|
Competencias / Resultados del título
|
A1 |
CE1 - Definir, evaluar y seleccionar la arquitectura y el software más adecuado para la resolución de un problema |
A2 |
CE2 - Analizar y mejorar el rendimiento de una arquitectura o un software dado |
B1 |
CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación |
B2 |
CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio |
B6 |
CG1 - Ser capaz de buscar y seleccionar la información útil necesaria para resolver problemas complejos, manejando con soltura las fuentes bibliográficas del campo |
B8 |
CG3 - Ser capaz de mantener y extender planteamientos teóricos fundados para permitir la introducción y explotación de tecnologías nuevas y avanzadas en el campo |
B10 |
CG5 - Ser capaz de trabajar en equipo, especialmente de carácter multidisciplinar, y ser hábiles en la gestión del tiempo, personas y toma de decisiones. |
C1 |
CT1 - Utilizar las herramientas básicas de las tecnologías de la información y las comunicaciones (TIC) necesarias para el ejercicio de su profesión y para el aprendizaje a lo largo de su vida |
C4 |
CT4 - Valorar la importancia que tiene la investigación, la innovación y el desarrollo tecnológico en el avance socioeconómico y cultural de la sociedad |
Resultados de aprendizaje |
Resultados de aprendizaje |
Competencias / Resultados del título |
El alumno será capaz de seleccionar, instalar, configurar y gestionar el software básico para el procesamiento de datos masivos.
|
AP1 AP2
|
BP2 BP6 BP8 BP10
|
CP1
|
El alumno será capaz de implementar códigos en algún lenguaje especializado en el procesamiento de datos masivos. |
AP2
|
BP1 BP2 BP10
|
CP1
|
El alumno conocerá y aprenderá a utilizar algunas de las herramientas disponibles para Data Engineering (en particular, par Ingesta/Almacenamiento/Procesado/Visualización). |
AP1 AP2
|
BP1 BP2
|
CP1 CP4
|
El alumno adquirirá la habilidad necesaria para la búsqueda, selección y manejo de recursos (bibliografía, software, etc.) relacionados con Big Data. |
AP1 AP2
|
BP1 BP6
|
CP1 CP4
|
Contenidos |
Tema |
Subtema |
1. Introducción a Data Engineering |
1.1 HPC vs Big Data: similitudes y diferencias en el tratamiento de datos
1.2 Tecnologías Hardware y Software para High Performance Data Engineering
1.3 Data Engineering en infraestructuras HPC vs entornos Cloud |
2. Introducción a Analítica de Datos |
2.1 Exploratory Data Analytics
2.2 Introducción a Machine Learning |
3. Etapas de Data Engineering |
3.1 Modelado (Formatos, Compresión, Diseño de Esquemas)
3.2 Ingesta (Periodicidad, Transformaciones, Herramientas)
3.3 Almacenamiento (HDFS y BBDD NoSQL, HBase, MongoDB, Cassandra)
3.4 Procesado (Batch, Real-Time)
3.5 Orquestación
3.6 Análisis (SQL, Machine Learning, Graphs, UI)
3.7 Gobernanza
3.8 Integración con BI (Visualización) |
4. Casos de Uso |
4.1 Aplicaciones en Internet de las Cosas (entornos Smart e Industria 4.0)
4.2 Aplicaciones en ciencias e ingeniería |
Planificación |
Metodologías / pruebas |
Competencias / Resultados |
Horas lectivas (presenciales y virtuales) |
Horas trabajo autónomo |
Horas totales |
Sesión magistral |
A1 A2 B1 C4 |
18 |
0 |
18 |
Prácticas de laboratorio |
B1 B8 B10 |
20 |
60 |
80 |
Trabajos tutelados |
A1 A2 B1 B2 B8 |
0 |
45 |
45 |
Discusión dirigida |
B6 C1 C4 |
4 |
2 |
6 |
|
Atención personalizada |
|
1 |
0 |
1 |
|
(*)Los datos que aparecen en la tabla de planificación són de carácter orientativo, considerando la heterogeneidad de los alumnos |
Metodologías |
Metodologías |
Descripción |
Sesión magistral |
Impartidas por los profesores de la asignatura. Incluyen exposición de material teórico, así como de seminarios. |
Prácticas de laboratorio |
Resolución de problemas y casos prácticos. |
Trabajos tutelados |
Realización de prácticas de mayor entidad de forma semiautónoma, guiados por los profesores de la asignatura. |
Discusión dirigida |
Orientación para la realización de los trabajos individuales o en grupo, resolución de dudas y actividades de evaluación continua. |
Atención personalizada |
Metodologías
|
Discusión dirigida |
Prácticas de laboratorio |
Trabajos tutelados |
|
Descripción |
Durante las prácticas de laboratorio, trabajos tutelados, y discusiones dirigidas, los estudiantes podrán presentar preguntas, dudas, etc. El profesor, atendiendo a sus solicitudes, repasará conceptos, resolverá nuevos problemas o utilizará cualquier actividad que considere adecuada para resolver las cuestions planteadas. |
|
Evaluación |
Metodologías
|
Competencias / Resultados |
Descripción
|
Calificación
|
Prácticas de laboratorio |
B1 B8 B10 |
Evaluación de las prácticas llevadas a cabo por los estudiantes. |
50 |
Trabajos tutelados |
A1 A2 B1 B2 B8 |
Evaluación de los trabajos tutelados desarrollados por los estudiantes. |
50 |
|
Observaciones evaluación |
No presentado: Se considerará no presentado al alumn@ que no entregue ninguna práctica ni trabajo académicamente dirigido. Segunda oportunidad (extraordinaria - junio / julio): Volver a realizar aquellas prácticas y trabajos tutelados que no se entregaran o versiones mejoradas de los ya entregados. Para los casos de realización fraudulenta de prácticas y trabajos académicamente dirigidos será de aplicación lo recogido en la normativa de la Universidad. En
concreto, la realización fraudulenta de pruebas o actividades de evaluación,
una vez comprobada, supondrá directamente la calificación de suspenso en la
convocatoria en la que se cometa: el alumno será calificado con "suspenso"
(calificación numérica 0) en la correspondiente convocatoria para la curso
académico, ya sea que la comisión de la infracción se produzca en la primera
oportunidad o en la segunda. Para ello, se modificará su calificación en el
informe de primera oportunidad, en caso de ser necesario.
|
Fuentes de información |
Básica
|
Tom White (2015). Hadoop: The Definitive Guide. O'Reilly (4ª ed.)
Wes McKinney (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly (2ª ed.) |
|
Complementária
|
Alex Holmes (2014). Hadoop in practice. Manning (2ª ed.) |
|
Recomendaciones |
Asignaturas que se recomienda haber cursado previamente |
|
Asignaturas que se recomienda cursar simultáneamente |
|
Asignaturas que continúan el temario |
|
Otros comentarios |
Recomendacionens para el estudio de la materia Debido al fuerte componente práctico es recomendable ir haciendo las actividades prácticas y trabajos académicamente dirigidos de forma regular a lo largo del cuatrimestre. El conocimiento del inglés tanto hablado como escrito es imprescindible dado que la bibliografía y las conferencias externas pueden desarrollarse en inglés. Observaciones Se hará un uso intensivo de herramientas de comunicación online: videoconferencia, chat, etc. Las sesiones presenciales serán grabadas para u revisión posterior. Además, se hará uso de la herramienta Aula CESGA para la distribución de contenidos, creación de foros de discusión, etc... Las herramientas software utilizadas en esta materia son generalmente open-source o tienen licencia gratuita para estudiantes. Perspectiva de género -Según las distintas normativas de aplicación a la docencia universitaria, se incorporará en esta asignatura la perspectiva de género (se utilizará un lenguaje no sexista, se utilizará bibliografía de autores de ambos sexos, se fomentará la participación del alumnado en clase... ) - Se trabajará para identificar y modificar prejuicios y actitudes sexistas e incidir en el entorno para modificarlos y promover valores de respeto e igualdad. -Se deberán detectar las situaciones de discriminación por razón de género y se propondrán acciones y medidas para corregirlas. |
|