Temas |
Subtemas |
Introducción a RI (1 horas)
|
Introducción a los modelos, técnicas, evaluación, sistemas de RI. |
Evaluación de sistemas de RI (2 horas) |
Tareas y métricas.
Colecciones de referencia. TREC.
Significancia estadística. |
Modelo booleano de RI (1 hora) |
Representación de documentos, consultas y medidas de similaridad.
Aplicaciones tradicionales exitosas.
Implementaciones eficientes. |
Modelos de espacio vectorial de RI (2 horas) |
Representación de docuementos, consultas y medidas de similaridad.
Esquemas de pesado.
Normalización.
Implementación eficiente. |
Modelo clásico probabilístico de RI (2 horas) |
Probability Ranking Principle
Derivación del modelo clásico probabilístico.
Otros modelos probabilísticos: 2-Poisson, Okapi, Redes de Inferencia.
Implementación eficiente.
|
Modelos estadísticos de lenguaje para RI (2 horas) |
Modelos de lenguaje.
Suavización.
Aprendizaje y estimación de parámetros.
Modelos de lengujaje basados en relevancia.
Implementación eficiente. |
Modelo Latent Semantic Indexing de RI (1 horas) |
Reducción de dimensionalidad basada en SVD.
Derivación del modelo LSI.
Cuestiones sobre la escalabilidad del modelo y nuevas aproxiamciones: LSI eficiente, LPI, etc. |
Realimentación de relevancia en RI (2 horas) |
Realimentación de relevancia bajo el modelo vectorial (Rocchio) y probabilístico.
Local Contex Analisys (LCA) y explansión de consultas.
|
Compresión y construcción de índices. Procesamiento de queries. (3 horas) |
Algoritmos de construcción de índices.
Algoritmos de compresión de índices: compresión de listas, compresión de frecuencias, compresión del léxico.
Procesamiento eficiente de consultas.
|
WebIR: modelos de retrieval, eficiencia, escalabilidad, problemas propios y oportunidades en RI en el web. (3 horas) |
Modelos de retrieval para el web.
Análisis de links.
Page Rank y HITS.
Implementación de searh engines.
Oportunidades de RI en el web.
|
IR distribuida (3 horas) |
IR paralela y distribuida.
Modelos de IR distribuida: selección de recursos, enrutado de consultas, fusión de resultados.
Aplicaciones novedoes en IR distribuida. |
NLP para IR (2 horas) |
Preprocesado.
Parsing.
Stemming.
Extracción de información. |