Datos Identificativos 2024/25
Asignatura (*) Fundamentos de Procesamento de Linguaxe Natural Código 614G03024
Titulación
Descriptores Ciclo Período Curso Tipo Créditos
Grao 2º cuadrimestre
Terceiro Optativa 6
Idioma
Castelán
Modalidade docente Presencial
Prerrequisitos
Departamento Ciencias da Computación e Tecnoloxías da Información
Coordinación
Alonso Pardo, Miguel angel
Correo electrónico
miguel.alonso@udc.es
Profesorado
Alonso Pardo, Miguel angel
Gómez Rodríguez, Carlos
Graña Gil, Jorge
Vilares Calvo, David
Vilares Ferro, Jesus
Correo electrónico
miguel.alonso@udc.es
carlos.gomez@udc.es
jorge.grana@udc.es
david.vilares@udc.es
jesus.vilares@udc.es
Web
Descrición xeral Introdúcense os conceptos básicos dos diferentes niveis de tratamento da lingua: léxico, sintáctico e semántico; así como os modelos estatísticos e de aprendizaxe automática que se aplican en cada un deles, como son os modelos de linguaxe baseados en n-gramas, os analizadores para os paradigmas sintácticos máis influentes (constituíntes e dependencias) e a creación de representacións semánticas.

Competencias / Resultados do título
Código Competencias / Resultados do título

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias / Resultados do título
Coñecer, comprender e analizar a representación formal de diversos fenómenos léxicos, sintácticos e semánticos da linguaxe humana B3
B9
C3
Coñecer, comprender e saber usar as tecnoloxías, marcos e librarías para a construción de sistemas de procesamento da linguaxe natural B7
B9
B10
C2
C3
Deseñar e implementar algoritmos e estruturas de datos para o tratamento de diversos fenómenos das linguaxes humanas B3
B7
B9
B10
C2
C3

Contidos
Temas Subtemas
Técnicas de preprocesado de textos Introdución ao procesamento da linguaxe natural
Particularidades das linguas
Preprocesamento
Representacións de palabras
Modelos de linguaxe Modelos de linguaxe baseados en n-gramas
Avaliación do modelo de linguaxe
Técnicas de suavizado
Modelos de linguaxe baseados en redes neuronais
Análise morfosintáctica Análise morfolóxica estatística
Análise morfolóxica con redes neuronais
Análise sintáctica baseada en constituíntes e en dependencias Análise sintáctica de constituíntes
Análise sintáctica de dependencias
Semántica léxica e os lexicóns de propósito específico Semántica léxica
Lexicóns de propósto específico
Semántica composicional das oracións Semántica da linguaxe natural
Representaciones semánticas

Planificación
Metodoloxías / probas Competencias / Resultados Horas lectivas (presenciais e virtuais) Horas traballo autónomo Horas totais
Proba obxectiva B3 B7 B9 C3 2 5.3 7.3
Prácticas de laboratorio B3 B7 B9 B10 C2 C3 21 56.7 77.7
Sesión maxistral B3 B7 B9 21 42 63
 
Atención personalizada 2 0 2
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Proba obxectiva Proba na que se evaluarán os coñecementos adquiridos tanto na parte teórica como na parte práctica da materia.
Prácticas de laboratorio Actividade que permite que os estudantes aprendan de forma efectiva a través da realización de actividades de carácter práctico.
Sesión maxistral Exposición oral complementada co uso de medios audiovisuais e a formulación de preguntas dirixidas ós estudantes, co obxetivo de transmitir coñecemento así como de estimular o razoamento crítico do estudiante.

Atención personalizada
Metodoloxías
Sesión maxistral
Prácticas de laboratorio
Descrición
O desenvolvemento das clases farase de acordo co progreso dos alumnos nas capacidades de comprensión e asimilación dos contidos ensinados, combinando o progreso xeral da clase cunha atención específica aos alumnos que presentan grandes dificultades na tarefa de aprendizaxe e con un apoio adicional a aqueles que presentan maior facilidade e queren ampliar o coñecemento.

Dada a natureza personalizada das titorías, estas non deberían dedicarse a ampliar o contido con novos conceptos, senón para aclarar os conceptos xa discutidos. O profesor tamén debe usalos como unha interacción que lle permita sacar conclusións sobre o grao de asimilación da materia polos estudantes.

Avaliación
Metodoloxías Competencias / Resultados Descrición Cualificación
Proba obxectiva B3 B7 B9 C3 Exame escrito 60
Prácticas de laboratorio B3 B7 B9 B10 C2 C3 Traballos de laboratorio 40
 
Observacións avaliación

A parte teórica da materia computa o 60% da nota. 

O 40% restante repártese entre as prácticas e calquera outra actividade de avaliación realizada ao longo do curso. Se as prácticas ou outras actividades se levan a cabo en grupos, todos os membros do grupo serán responsables solidariamente polo traballo realizado e entregado e as súa posibles consecuencias.

Para aprobar a materia é necesario aprobar todas e cada unha das seccións da avaliación. Para a Segunda Oportunidade, manteranse os resultados obtidos en cada sección da Primeira Oportunidade. No caso de que non se cumplan as condicións para aprobar, nas actas figurará a nota mínima entre 4,5 e a que resulte do cálculo conxunto.

No caso de estudantes a tempo parcial, a falta de asistencia xustificadas non serán penalizadas.

Os aspectos relacionados con “dispensa académica”, “dedicación ao estudo”, “permanencia” e “fraude académica” rexeranse de acordo coa normativa académica vixente da UDC.


Fontes de información
Bibliografía básica Subir Christopher D. Manning; Hinrich Schütze (1999). Foundations of Statistical Natural Language Processing. MIT Press (ISBN 78-0262133609)
Daniel Jurafsky; James H. Marti (2024). Speech and Language Processing, Draft 3rd Edition. https://web.stanford.edu/~jurafsky/slp3/

Bibliografía complementaria Lewis Tunstall, Leandro von Werra, and Thomas Wolf (2022). Natural Language Processing with Transformers. O'Reilly Media, Inc. ISBN: 9781098103248


Recomendacións
Materias que se recomenda ter cursado previamente
Autómatas e Linguaxes Formais/614G03017
Fundamentos de Aprendizaxe Automática/614G03018

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario
Interacción Intelixente/614G03041
Técnicas Avanzadas de Procesamento de Linguaxe Natural/614G03025

Observacións

Esta materia forma parte do Módulo de Linguaxe Natural do Grao en Intelixencia Artificial da UDC. Este módulo abrangue materias clave que se ocupan do estudo e desenvolvemento de sistemas capaces de procesar a linguaxe humana.

En primeiro lugar, a materia Fundamentos de Procesamento da Linguaxe Natural introduce ao alumno no campo tecnolóxico do mesmo nome, campo que aplica tecnoloxías de intelixencia artificial, aprendizaxe automática e modelos estatísticos para construír sistemas computacionais capaces de procesar información expresada en linguaxe humana, como é a gran maioría da información dispoñible en Internet.

Sobre eses fundamentos, a materia Técnicas Avanzadas de Procesamento de Linguaxe Natural avanza nas técnicas, métodos e ferramentas que definen o estado da cuestión no tratamento automático da lingua, constituído por aqueles baseados en aprendizaxe profunda e que tratan aspectos multilingües e translingües, así como aplicacións tales como a análise do sentimento, a procura de respostas ou a tradución automática.

Na materia Interación Intelixente preséntanse aspectos avanzados da comunicación entre persoas e ordenadores que van desde a comprensión da estrutura argumental nun texto ata o tratamento da interacción multimodal mediante o recoñecemento de xestos e expresións faciais, entre outros.

Fomentarase o desenvolvemento dunha cidadanía crítica, aberta e respectuosa coa diversidade na nosa sociedade, salientando a igualdade de dereitos do alumnado sen discriminación por cuestión de xénero ou condición sexual. Empregarase unha linguaxe inclusiva no material e no desenvolvemento das sesións. Traballarase para identificar e modificar prexuizos e actitudes sexistas e influirase na contorna para modificalos e fomentar valores de respecto e igualdade.  Facilitarase a plena integración do alumnado que por razóns físicas, sensoriais, psíquicas ou socioculturais, experimenten dificultades a un acceso axeitado, igualitario e proveitoso á vida universitaria.



(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías