En esta materia se aborda el área del aprendizaje automático en entornos donde existe una gran cantidad de datos a analizar. En este contexto surgen ciertas problemáticas que hacen que muchos de los sistemas de aprendizaje clásicos no sean directamente aplicables por motivos de complejidad computacional. El aprendizaje automático a escala trata dos ámbitos de escalabilidad diferentes. La primera es el entrenamiento de un modelo con grandes conjuntos de datos, que necesita las funcionalidades de la escalabilidad sobre un clúster de ordenadores para realizar el entrenamiento. El segundo se centra en la puesta en operación del modelo entrenado de manera que se pueda escalar para cumplir las necesidades de las aplicaciones que lo consumen.
Con el aprendizaje automático a gran escala, el enfoque se desplaza hacia los datos y la tarea. El tiempo dedicado a la tarea y los datos es significativo y, a menudo, mucho más grande de lo previsto. El objetivo de esta materia es proporcionar una visión clara sobre los conceptos del “Big Data” en el ámbito del aprendizaje automático.
(*) La Guía Docente es el documento donde se visualiza la propuesta académica de la UDC. Este documento es público y no se puede modificar, salvo cosas excepcionales bajo la revisión del órgano competente de acuerdo a la normativa vigente que establece el proceso de elaboración de guías