Datos Identificativos | 2012/13 | |||||||||||||
Asignatura | Modelos e Técnicas Avanzadas de Recuperación da Información | Código | 614451119 | |||||||||||
Titulación |
|
|||||||||||||
Descriptores | Ciclo | Período | Curso | Tipo | Créditos | |||||||||
Mestrado Oficial | 1º cuadrimestre |
Primeiro | Optativa | 3 | ||||||||||
|
Temas | Subtemas |
Introducción a RI (1 horas) |
Introducción a los modelos, técnicas, evaluación, sistemas de RI. |
Evaluación de sistemas de RI (2 horas) | Tareas y métricas. Colecciones de referencia. TREC. Significancia estadística. |
Modelo booleano de RI (1 hora) | Representación de documentos, consultas y medidas de similaridad. Aplicaciones tradicionales exitosas. Implementaciones eficientes. |
Modelos de espacio vectorial de RI (2 horas) | Representación de docuementos, consultas y medidas de similaridad. Esquemas de pesado. Normalización. Implementación eficiente. |
Modelo clásico probabilístico de RI (2 horas) | Probability Ranking Principle Derivación del modelo clásico probabilístico. Otros modelos probabilísticos: 2-Poisson, Okapi, Redes de Inferencia. Implementación eficiente. |
Modelos estadísticos de lenguaje para RI (2 horas) | Modelos de lenguaje. Suavización. Aprendizaje y estimación de parámetros. Modelos de lengujaje basados en relevancia. Implementación eficiente. |
Modelo Latent Semantic Indexing de RI (1 horas) | Reducción de dimensionalidad basada en SVD. Derivación del modelo LSI. Cuestiones sobre la escalabilidad del modelo y nuevas aproxiamciones: LSI eficiente, LPI, etc. |
Realimentación de relevancia en RI (2 horas) | Realimentación de relevancia bajo el modelo vectorial (Rocchio) y probabilístico. Local Contex Analisys (LCA) y explansión de consultas. |
Compresión y construcción de índices. Procesamiento de queries. (3 horas) | Algoritmos de construcción de índices. Algoritmos de compresión de índices: compresión de listas, compresión de frecuencias, compresión del léxico. Procesamiento eficiente de consultas. |
WebIR: modelos de retrieval, eficiencia, escalabilidad, problemas propios y oportunidades en RI en el web. (3 horas) | Modelos de retrieval para el web. Análisis de links. Page Rank y HITS. Implementación de searh engines. Oportunidades de RI en el web. |
IR distribuida (3 horas) | IR paralela y distribuida. Modelos de IR distribuida: selección de recursos, enrutado de consultas, fusión de resultados. Aplicaciones novedoes en IR distribuida. |
NLP para IR (2 horas) | Preprocesado. Parsing. Stemming. Extracción de información. |