Temas Subtemas
Introducción
Recuperación de Información y Search Engines. Arquitectura de un Search Engine. Grandes retos.
Recopilación de información.
Crawling y feeds.
Procesamiento de texto.
Preprocesamiento. Parsing, documentos estructurados, anchor text y análisis de enlaces, internacionalización
Indices y procesado eficiente.
Indices Invertidos, compresión, construcción, procesado eficiente de consultas sobre índices invertidos
Formulación de consultas y presentación de resultados
Transformación de consultas, relevance feedback, pseudo-feedback, snippets y visualización de resultados
Modelos de recuperación de información.
Booleano, espacio vectorial, probabilístico, BM25, Language Models y Relevance Models.
Evaluación de sistemas de Recuperación de Información.
Colecciones e iniciativas de evaluación. Métricas de eficacia y eficiencia. Training y test. Significancia estadística
Búsqueda distribuida y social.
Meta-buscadores y búsqueda distribuida, blogs, redes sociales, sistemas de recomendación.