Datos Identificativos 2021/22
Asignatura (*) Procesamento da Linguaxe Escrita Código 614G02029
Titulación
Grao en Ciencia e Enxeñaría de Datos
Descriptores Ciclo Período Curso Tipo Créditos
Grao 2º cuadrimestre
Terceiro Obrigatoria 6
Idioma
Castelán
Galego
Modalidade docente Presencial
Prerrequisitos
Departamento Ciencias da Computación e Tecnoloxías da Información
Coordinación
Dafonte Vazquez, Jose Carlos
Correo electrónico
carlos.dafonte@udc.es
Profesorado
Alonso Pardo, Miguel angel
Dafonte Vazquez, Jose Carlos
Garabato Míguez, Daniel
Vilares Calvo, David
Correo electrónico
miguel.alonso@udc.es
carlos.dafonte@udc.es
daniel.garabato@udc.es
david.vilares@udc.es
Web http://https://campusvirtual.udc.gal
Descrición xeral A materia introduce nocións necesarias para procesar información, tanto en linguaxes formais empregadas para datos estruturados como en linguaxe humana. A materia inclúe tanto os fundamentos básicos do procesamento da linguaxe estruturada para o deseño de recoñecedores: análise léxica, sintáctica e semántica; como do procesamento da linguaxe natural: modelado da linguaxe, análise morfolóxica e sintáctica.
Plan de continxencia 1. Modificacións nos contidos

Non hai cambios

2. Metodoloxías

*Metodoloxías docentes que se manteñen

As metodoloxías docentes mantéñense pero adaptando a súa realización á docencia non presencial mediante as ferramentas proporcionadas pola UDC (Moodle e Teams).Así temos:

- Sesión maxistral: Nstas sesiones analízanse en profundidade os concetos teóricos e técnicas principais. Utilizarase a canle de Teams para a exposición, o Moodle da materia para aa publicación da documentación e os foros específicos en Moodle para a proposta de ejercicios.

- Prácticas de laboratorio: A documentación necesaria e instruccións de entrega publicaranse no Moodle da materia e utilizarase a canle de Teams para o seguimento e consulta síncrona nos horarios correspondientes. También se atenderán as consultas a través dos foros de prácticas creados en Moodle.

As metodoloxías indicadas para a entrega e evaluación das prácticas de laboratorio aplicaranse de modo similar tanto ao final del cuadrimestre como para a segunda oportunidade.

*Metodoloxías docentes que se modifican

As probas de evaluación poderían pasar a realizarse online.

3. Mecanismos de atención personalizada ao alumnado

- Moodle. Periodicidade: Semanal. Realizarase a publicación dos contidos, tareas, mensajes en foros, etc. necesarios para o seguimiento normal da materia. Ademáis, independentemente destas publicacións, responderase ás consultas do alumnado nos foros en canto sexa posible.

- Teams. Periodicidade: Semanal. Utilízase para a docencia non presencial da materia, cumprindo os horarios do calendario académico establecidos polo centro. Ademáis, independentemente deste horario, responderase ás consultas do alumnado na canle de Teams da materia en canto sexa posible.

4. Modificacións na avaliación

Non hay variacións

*Observacións de avaliación:

O único cambio sería que a proba obxectiva podería pasar a realizarse online. En tal caso, indicarase no Moodle da materia as condicións de realización, supervisión, entrega e custodia das probas.

5. Modificacións da bibliografía ou webgrafía

Non hai cambios

Competencias do título
Código Competencias do título
A28 CE28 - Comprensión e dominio dos fundamentos e técnicas para o procesado de datos escritos, tanto en linguaxe formal como en linguaxe natural.
B2 CB2 - Que os estudantes saiban aplicar os seus coñecementos ao seu traballo ou vocación dunha forma profesional e posúan as competencias que adoitan demostrarse por medio da elaboración e defensa de argumentos e a resolución de problemas dentro da súa área de estudo
B3 CB3 - Que os estudantes teñan a capacidade de reunir e interpretar datos relevantes (normalmente dentro da súa área de estudo) para emitir xuízos que inclúan unha reflexión sobre temas relevantes de índole social, científica ou ética
B4 CB4 - Que os estudantes poidan transmitir información, ideas, problemas e solucións a un público tanto especializado como non especializado
B7 CG2 - Elaborar adecuadamente e con certa orixinalidade composicións escritas ou argumentos motivados, redactar plans, proxectos de traballo, artigos científicos e formular hipóteses razoables.
B8 CG3 - Ser capaz de manter e estender formulacións teóricas fundadas para permitir a introdución e explotación de tecnoloxías novas e avanzadas no campo.
B9 CG4 - Capacidade para abordar con éxito todas as etapas dun proxecto de datos: exploración previa dos datos, preprocesado, análise, visualización e comunicación de resultados.
B10 CG5 - Ser capaz de traballar en equipo, especialmente de carácter multidisciplinar, e ser hábiles na xestión do tempo, persoas e toma de decisións.
C1 CT1 - Utilizar as ferramentas básicas das tecnoloxías da información e as comunicacións (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida.
C4 CT4 - Valorar a importancia que ten a investigación, a innovación e o desenvolvemento tecnolóxico no avance socioeconómico e cultural da sociedade.

Resultados de aprendizaxe
Resultados de aprendizaxe Competencias do título
Coñecer, comprender e analizar a representación formal de diversos fenómenos léxicos, sintácticos e semánticos da linguaxe A28
B3
B4
B7
B8
B10
C4
Coñecer, comprender e saber usar as tecnoloxías, marcos e bibliotecas para a construción de sistemas de procesamento da linguaxe A28
B2
B3
B4
B7
B8
B9
B10
C1
C4
Deseñar, implementar e saber usar algoritmos e estruturas de datos para tratar e dar soporte aos diversos fenómenos característicos da linguaxe A28
B2
B3
B4
B7
B8
B9
B10
C1
C4

Contidos
Temas Subtemas
Tema I. Fundamentos da lenguaxe estructurada 1.1. Conceptos básicos: gramáticas e linguaxes
1.2. Fases e compoñentes dun procesador de linguaxe
1.3. Contornos de aplicación da Teoría de Linguaxes
Tema II. Análise léxica 2.1. Autómatas finitos, expresións regulares e gramáticas regulares
2.2. Conversión entre distintas representacións
2.3. Implementación de autómatas e expresións regulares
Tema III. Análise sintáctica 3.1. Linguaxes de contexto libre e gramáticas independentes do contexto
3.2. Recoñecedores descendentes recursivos e LL (k)
3.3. Recoñecedores LR (k)
Tema IV. Análise semántica e deseño de accións semánticas 4.1. Control de atributos
4.2. Tratamento de erros
4.3. Xeración dirixida pola sintaxe
Tema V. Introdución ao procesamento da linguaxe natural 5.1. Niveis de análise
5.2. Ambigüidade
Tema VI. Modelado da lenguaxe 6.1. Modelos de linguaxe baseados en n-gramas
6.2. Avaliación do modelo de linguaxe
6.3. Técnicas de suavizado
6.4. Modelos de linguaxe baseados en redes neuronais
Tema VII. Análise morfolóxica da linguaxe natural 7.1. Fundamentos da análise morfolóxica
7.2. Análise morfolóxica estatística
7.3. Análise morfolóxica con redes neuronais
Tema VIII. Fundamentos de análise sintáctica da linguaxe natural 8.1. Fundamentos da análise sintáctica de constituíntes
8.2. Fundamentos da análise sintáctica de dependencias

Planificación
Metodoloxías / probas Competencias Horas presenciais Horas non presenciais / traballo autónomo Horas totais
Sesión maxistral A28 B4 B8 B9 C4 21 27.3 48.3
Proba obxectiva A28 B2 B3 B7 B9 3 18 21
Prácticas de laboratorio A28 B2 B3 B4 B7 B8 B9 B10 C1 21 35.7 56.7
 
Atención personalizada 24 0 24
 
*Os datos que aparecen na táboa de planificación son de carácter orientativo, considerando a heteroxeneidade do alumnado

Metodoloxías
Metodoloxías Descrición
Sesión maxistral Nas clases teóricas, os profesores desenvolverán o contido teórico e algúns exercicios complementarios
Proba obxectiva Proba na que se evaluarán os coñecementos adquiridos
Prácticas de laboratorio Permiten ao alumno aprender con eficacia a través de actividades aplicadas, neste caso realizando proxectos en forma de prácticas.

Atención personalizada
Metodoloxías
Prácticas de laboratorio
Sesión maxistral
Descrición
O desenvolvemento das clases farase de acordo co progreso dos alumnos nas capacidades de comprensión e asimilación dos contidos ensinados, combinando o progreso xeral da clase cunha atención específica aos alumnos que presentan grandes dificultades na tarefa de aprendizaxe e con un apoio adicional a aqueles que presentan maior facilidade e queren ampliar o coñecemento.

Dada a natureza personalizada das titorías, estas non deberían dedicarse a ampliar o contido con novos conceptos, senón para aclarar os conceptos xa discutidos. O profesor tamén debe usalos como unha interacción que lle permita sacar conclusións sobre o grao de asimilación da materia polos estudantes.

Avaliación
Metodoloxías Competencias Descrición Cualificación
Prácticas de laboratorio A28 B2 B3 B4 B7 B8 B9 B10 C1 Realización segundo as condicións establecidas no enunciado de cada práctica. 40
Proba obxectiva A28 B2 B3 B7 B9 Realizarase un exame ao final do semestre e a correspondente 2a oportunidade. Este exame centrarase principalmente nos aspectos teóricos e exercicios asociados. Non obstante, poderá preguntarse algunha cuestión relacionada coas prácticas e os traballos tutlados realizados. 60
 
Observacións avaliación

O exame computa o 60% da nota e o 40% restante repártese entre as
prácticas e calquera outra actividade avaliable realizada ao longo do
curso. Será necesario acadar un mínimo de 3 (sobre 6, no exame) e un 2
(sobre 4, no conxunto das prácticas e demáis actividades). En caso de non acadar
algún dos mínimos, a máxima nota que se poderá obter é un 4.5.

Se
as prácticas ou outras actividades se levan a cabo en grupos, todos os
membros do grupo serán responsables solidariamente polo traballo
realizado e entregado así como as súas posibles implicacións. Para aprobar a
materia é necesario aprobar todas e cada unha das seccións da
avaliación. Para a segunda oportunidade, manteranse os resultados
obtidos en cada sección (exame e prácticas) da primeira oportunidade

No caso de estudantes a tempo parcial, a falta de asistencia ás clases de prácticas e TGR xustificadas non será penalizada.

O estudante que non concurra á proba obxectiva no período oficial de avaliación, terá a condición de “Non
presentado” (NP).

A realización fraudulenta das probas ou actividades de avaliación, unha vez comprobada, implicará directamente a cualificación de suspenso '0' na materia na oportunidade correspondente


Fontes de información
Bibliografía básica Aho, A.V.; Lam, M.; Sethi, R.; Ullman, J.D. (2008). Compiladores: Principios, técnicas y herramientas. Addison-Wesley
Garrido, A.; Iñesta, J.M.; Moreno, F.; Pérez, J.A. (2004). Diseño de compiladores. Publicaciones de la Universidad de Alicante
Christopher D. Manning; Hinrich Schütze (1999). Foundations of Statistical Natural Language Processing. MIT Press (ISBN 78-0262133609)
Hopcroff, J.E.; Motwani, R.; Ullman, J. D. (2002). Introducción a la teoría de autómatas, lenguajes y computación. Addison-Wesley
Daniel Jurafsky; James H. Martin (2021). Speech and Language Processing, Draft 3rd Edition. https://web.stanford.edu/~jurafsky/slp3/

Bibliografía complementaria Benjamin Bengfort; Rebecca Bilbro; Tony Ojeda (2018). Applied Text Analysis with Python. O'Reilly Media, Inc (ISBN 9781491963043)
Louden, D.K. (2004). Construcción decompiladores. Principios y Práctica. Paraninfo Thomson Learning
Sudkamp, T.A. (1994). Languages and machines. Addison-Wesley
Noah A. Smith (2011). Linguistic Structure Prediction . Morgan & Claypool (ISBN 978-1608454051)
Yoav Goldberg (2017). Neural Network Methods for Natural Language Processing. Morgan & Claypool Publishers (ISBN 978-1627052986)
Aho, A.V.; Ullman, J.D. (1972). The theory of parsing, translation and compiling. Prentice-Hall


Recomendacións
Materias que se recomenda ter cursado previamente
Álxebra Lineal/614G02001
Fundamentos de Programación II/614G02009
Fundamentos de Programación I/614G02004
Inferencia Estatística/614G02007
Probabilidade e Estatística Básica/614G02003

Materias que se recomenda cursar simultaneamente

Materias que continúan o temario
Linguaxe Natural e Minaría de Textos/614G02043

Observacións


(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías