Guia docenteCurso
Facultad de Informática
  Inicio | galego | castellano | A A |  
Mestrado Universitario en Enxeñaría de Sistemas Informáticos
 Asignaturas
  Modelos e Técnicas Avanzadas de Recuperación da Información
   Contidos
Temas Subtemas
Introducción a RI (1 horas)
Introducción a los modelos, técnicas, evaluación, sistemas de RI.
Evaluación de sistemas de RI (2 horas) Tareas y métricas.
Colecciones de referencia. TREC.
Significancia estadística.
Modelo booleano de RI (1 hora) Representación de documentos, consultas y medidas de similaridad.
Aplicaciones tradicionales exitosas.
Implementaciones eficientes.
Modelos de espacio vectorial de RI (2 horas) Representación de docuementos, consultas y medidas de similaridad.
Esquemas de pesado.
Normalización.
Implementación eficiente.
Modelo clásico probabilístico de RI (2 horas) Probability Ranking Principle
Derivación del modelo clásico probabilístico.
Otros modelos probabilísticos: 2-Poisson, Okapi, Redes de Inferencia.
Implementación eficiente.
Modelos estadísticos de lenguaje para RI (2 horas) Modelos de lenguaje.
Suavización.
Aprendizaje y estimación de parámetros.
Modelos de lengujaje basados en relevancia.
Implementación eficiente.
Modelo Latent Semantic Indexing de RI (1 horas) Reducción de dimensionalidad basada en SVD.
Derivación del modelo LSI.
Cuestiones sobre la escalabilidad del modelo y nuevas aproxiamciones: LSI eficiente, LPI, etc.
Realimentación de relevancia en RI (2 horas) Realimentación de relevancia bajo el modelo vectorial (Rocchio) y probabilístico.
Local Contex Analisys (LCA) y explansión de consultas.
Compresión y construcción de índices. Procesamiento de queries. (3 horas) Algoritmos de construcción de índices.
Algoritmos de compresión de índices: compresión de listas, compresión de frecuencias, compresión del léxico.
Procesamiento eficiente de consultas.

WebIR: modelos de retrieval, eficiencia, escalabilidad, problemas propios y oportunidades en RI en el web. (3 horas) Modelos de retrieval para el web.
Análisis de links.
Page Rank y HITS.
Implementación de searh engines.
Oportunidades de RI en el web.
IR distribuida (3 horas) IR paralela y distribuida.
Modelos de IR distribuida: selección de recursos, enrutado de consultas, fusión de resultados.
Aplicaciones novedoes en IR distribuida.
NLP para IR (2 horas) Preprocesado.
Parsing.
Stemming.
Extracción de información.
Universidade da Coruña - Rúa Maestranza 9, 15001 A Coruña - Tel. +34 981 16 70 00  Soporte Guías Docentes