Datos Identificativos 2023/24
Asignatura (*) IA en Entornos Big Data Código 614544016
Titulación
Máster Universitario en Intelixencia Artificial
Descriptores Ciclo Periodo Curso Tipo Créditos
Máster Oficial 1º cuatrimestre
Segundo Optativa 6
Idioma
Inglés
Modalidad docente Presencial
Prerrequisitos
Departamento Ciencias da Computación e Tecnoloxías da Información
Coordinador/a
Bolón Canedo, Verónica
Correo electrónico
veronica.bolon@udc.es
Profesorado
Alonso Ríos, David
Bolón Canedo, Verónica
Correo electrónico
david.alonso@udc.es
veronica.bolon@udc.es
Web
Descripción general A cada vez maior cantidade de información accesible a través de Internet fai que o procesamiento eficiente de grandes cantidades de datos sexa cada vez de maior interese. Isto levou ao desenvolvemento de novas técnicas de almacenamento e procesamiento de inxentes cantidades de información, técnicas que se adaptan de forma natural aos sistemas distribuídos.

O obxectivo principal desta materia é proporcionar aos estudantes os coñecementos e habilidades necesarios para comprender, desenvolver e aplicar técnicas de intelixencia artificial (IA) en contornas de Big Data.

Competencias del título
Código Competencias del título
A11 CE10 - Capacidad para la construcción, validación y aplicación de un modelo estocástico de un sistema real a partir de los datos observados y el análisis crítico de los resultados obtenidos
A12 CE11 - Comprensión y dominio de las principales técnicas y herramientas de análisis de datos, tanto desde el punto de vista estadístico como del aprendizaje automático, incluyendo las dedicadas al tratamiento de grandes volúmenes de datos, y capacidad para seleccionar las más adecuadas para la resolución de problemas.
A13 CE12 - Capacidad para plantear, formular y resolver todas las etapas de un proyecto de datos, incluyendo la compresión y dominio de fundamentos y técnicas básicas para la búsqueda y el filtrado de información en grandes colecciones de datos
A16 CE15 - Conocimiento de las herramientas informáticas en el campo del aprendizaje automático, y capacidad para seleccionar la más adecuada para la resolución de un problema
B2 CG02 - Abordar con éxito todas las etapas de un proyecto de Inteligencia Artificial
B3 CG03 - Buscar y seleccionar la información útil necesaria para resolver problemas complejos, manejando con soltura las fuentes bibliográficas del campo
B4 CG04 - Elaborar adecuadamente y con cierta originalidad composiciones escritas o argumentos motivados, redactar planes, proyectos de trabajo, artículos científicos y formular hipótesis razonables en el campo
B5 CG05 - Trabajar en equipo, especialmente de carácter multidisciplinar, y ser hábiles en la gestión del tiempo, personas y toma de decisiones
B6 CB01 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
B7 CB02 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
B8 CB03 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
B9 CB04 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigu?edades
C3 CT03 - Utilizar las herramientas básicas de las tecnologías de la información y las comunicaciones (TIC) necesarias para el ejercicio de su profesión y para el aprendizaje a lo largo de su vida
C4 CT04 - Desarrollarse para el ejercicio de una ciudadanía respetuosa con la cultura democrática, los derechos humanos y la perspectiva de género
C7 CT07 - Desarrollar la capacidad de trabajar en equipos interdisciplinares o transdisciplinares, para ofrecer propuestas que contribuyan a un desarrollo sostenible ambiental, económico, político y social
C8 CT08 - Valorar la importancia que tiene la investigación, la innovación y el desarrollo tecnológico en el avance socioeconómico y cultural de la sociedad
C9 CT09 - Tener la capacidad de gestionar tiempos y recursos: desarrollar planes, priorizar actividades, identificar las críticas, establecer plazos y cumplirlos

Resultados de aprendizaje
Resultados de aprendizaje Competencias del título
Conocer las técnicas que permiten el diseño de técnicas de IA escalables a nivel software y de recursos hardware AM10
AM11
AM12
AM15
BM2
BM7
CM3
CM4
Adquirir las competencias que permitan integran gran volumen y variedad de datos en proyectos de Big Data en IA AM10
AM11
AM12
AM15
BM3
BM4
BM5
BM6
BM7
BM8
BM9
CM3
CM4
CM7
CM8
CM9
Conocer los paradigmas de escalabilidad en algoritmos de aprendizaje automático AM10
AM11
AM12
AM15
BM2
BM3
BM4
BM5
BM6
BM7
BM8
BM9
CM3
CM4
CM7
CM8
CM9
Comprender, analizar y diseñar las infraestructuras necesarias para proyectos de IA en BigData: entorno local/nube y equipamiento físico/virtual con sistemas de almacenamiento de baja latencia y sistemas de ficheros distribuidos AM12
AM15
BM2
BM6
BM7
BM8
CM3
CM4
CM7
CM9
Conocer los lenguajes, frameworks y componentes que nos permiten incrementar el rendimiento en las infraestructuras hardware con CPU y GPU AM11
AM15
BM3
BM7
BM8
CM3
CM4
CM7
CM9
Conocer las técnicas que permiten, con baja latencia, la visualización de datos en entornos con gran volumen de información AM11
AM12
AM15
BM2
BM3
BM5
BM6
BM7
BM8
BM9
CM3
CM4
CM7
CM8
CM9
Usar y poder aplicar los KPI correctos en cada entorno AM10
AM11
AM15
BM2
BM3
BM7
BM8
CM3
CM9

Contenidos
Tema Subtema
Introdución ao Big Data Que é Big Data
Aplicacións Big Data
Analítica Big Data
Problemática da análise de datos en contornas Big Data
Preparación e visualización de datos Técnicas de preprocesado de datos
Técnicas de visualización
Aprendizaxe federada Aprendizaxe no borde
Preservación da privacidade
Infraestructuras para o almacenamento e procesamento de Big Data: Apache Hadoop e Apache Spark Procesamento distribuido e infraestructuras
Aprendizaxe por lotes en plataformas paralelas e distribuidas
Aprendizaxe distribuida en vertical e horizontal
Tratamento de datos en continuo Aprendizaxe incremental
Aprendizaxe en tempo real
Problemas de cambio de concepto

Planificación
Metodologías / pruebas Competéncias Horas presenciales Horas no presenciales / trabajo autónomo Horas totales
Prácticas a través de TIC A11 A12 A13 A16 B2 B3 B4 B5 B6 B7 B8 B9 C3 C7 C8 C9 14 44 58
Trabajos tutelados A11 A12 B3 B4 B5 B6 B9 C4 C7 C8 7 20 27
Prueba objetiva A11 A12 A13 B2 B6 B7 B8 B9 C4 C8 C9 2 20 22
Sesión magistral A11 A12 A13 A16 B2 B3 B4 B6 B8 B9 C4 C8 C9 21 20 41
 
Atención personalizada 2 0 2
 
(*)Los datos que aparecen en la tabla de planificación són de carácter orientativo, considerando la heterogeneidad de los alumnos

Metodologías
Metodologías Descripción
Prácticas a través de TIC Clases prácticas na aula de informática, que permiten ao alumno familiarizarse desde un punto de vista práctico coas cuestións expostas nas clases teóricas.
Trabajos tutelados Aprendizaxe baseada en problemas, seminarios, estudo de casos ou proxectos, que permiten que o alumnado adquira determinadas competencias en base á resolución de exercicios, estudo de casos e realización de proxectos.
Prueba objetiva Proba de avaliación escrita na que o alumno deberá demostrar os coñecementos adquiridos na asignatura
Sesión magistral Clases de teoría, nas que se expón o contido de cada tema. O alumno disporá de copias das transparencias con anterioridade e o profesor promoverá unha actitude activa, realizando preguntas que permitan aclarar aspectos concretos e deixando cuestións abertas para a reflexión do alumno.

Atención personalizada
Metodologías
Prácticas a través de TIC
Trabajos tutelados
Descripción
Realización do traballo práctico co asesoramiento do profesor. Redacción de documentos de compendio dos resultados na forma de memorias ou artígos, así como a presentación dos resultados có profesor ou en sesións públicas dentro da clase.

Evaluación
Metodologías Competéncias Descripción Calificación
Prácticas a través de TIC A11 A12 A13 A16 B2 B3 B4 B5 B6 B7 B8 B9 C3 C7 C8 C9 Avaliación de traballos prácticos: 50% dá nota
avaliaranse as solucións propostas polo alumnado ás prácticas expostas. A avaliación de prácticas pode levar a cabo
mediante unha corrección por parte do profesor, unha defensa da solución achegada por parte do alumno ante o profesor ou unha presentación oral da solución desenvolvida. Todos os traballos deberán ser entregados antes das datas que se especificarán e deberán cumprir uns requisitos mínimos de calidade para ser tidos en consideración. Valorarase o grao de cumprimento das especificacións, a metodoloxía e rigorosidade e a presentación de resultados
50
Prueba objetiva A11 A12 A13 B2 B6 B7 B8 B9 C4 C8 C9 Preguntas sobre os contidos da asignatura (que poden ser de tipo test ou problemas para resolver), baseada nas distintas técnicas avanzadas de aprendizaxe automática e as súas aplicacións. 50
 
Observaciones evaluación

Para superar a materia, debe conseguirse unha puntuación total de 5 ou superior. É imprescindible para aprobar entregar todas as prácticas indicadas como obrigatorias.


Condición para cualificación de Non Presentado: non presentar ningunha práctica e non asistir ao exame final.


Os alumnos que non sexan de nova matrícula non conservan notas de cursos anteriores.


Oportunidade de recuperación (xullo) e extraordinaria:


A valoración será igual que na oportunidade ordinaria. Os alumnos que non entregaron os traballos propostos ao longo do cuadrimestre deberanos entregar antes da data establecida.


Condición para cualificación de Non Presentado: non presentar ningunha práctica e non asistir ao exame final.


O traballo entregado deberá ser orixinal do alumno. De acordo ao artigo 14, apartado 4, da normativa, a entrega de traballos non orixinais ou con partes duplicadas (sexa por copias entre compañeiros ou por obtención doutras fontes...) levará unha nota global de SUSPENSO NA CONVOCATORIA ANUAL, tanto para o/a estudante que presente material copiado como a quen o facilitase. 

 


Fuentes de información
Básica

- Apuntes proporcionados por el profesor

- T. White, Hadoop: The Definitive Guide, 4th Edition, O'Reilly, 2015

- B. Chambers, M. Zaharia, Spark: The Definitive Guide, O'Reilly, 2018

Complementária

- Karim, Md. Rezaul, Sridhar Alla. Scala and Spark for Big Data Analytics: Tame Big Data with Scala and Apache Spark! 1st edition. Birmingham: Packt, 2017.

- Pentreath, Nick. Machine Learning with Spark Create Scalable Machine Learning Applications to Power a Modern Data-Driven Business Using Spark Packt Publishing Ltd., 2015.

- Bowles, Michael. Machine Learning with Spark and Python: Essential Techniques for Predictive Analytics 2nd ed. Wiley, 2019


Recomendaciones
Asignaturas que se recomienda haber cursado previamente
Fundamentos de IA/614544001
Aprendizaje Automático I/614544012
Aprendizaje Automático II/614544014

Asignaturas que se recomienda cursar simultáneamente

Asignaturas que continúan el temario

Otros comentarios


(*) La Guía Docente es el documento donde se visualiza la propuesta académica de la UDC. Este documento es público y no se puede modificar, salvo cosas excepcionales bajo la revisión del órgano competente de acuerdo a la normativa vigente que establece el proceso de elaboración de guías