Datos Identificativos | 2024/25 | |||||||||||||
Asignatura | Recuperación da Información | Código | 614G01040 | |||||||||||
Titulación |
|
|||||||||||||
Descriptores | Ciclo | Período | Curso | Tipo | Créditos | |||||||||
Grao | 2º cuadrimestre |
Terceiro | Optativa | 6 | ||||||||||
|
Temas | Subtemas |
Introducción |
Recuperación de Información e Search Engines. Arquitectura dun Search Engine. Grandes retos. |
Recopilación de información. |
Crawling e feeds. |
Procesamento de texto. |
Preprocesamento. Parsing, documentos estructurados, anchor text e análisis de enlaces, internacionalización |
Indices e procesado eficiente. |
Indices Invertidos, compresión, construcción, procesado eficiente de consultas sobre índices invertidos |
Formulación de consultas e presentación de resultados |
Transformación de consultas, relevance feedback, pseudo-feedback, snippets e visualización de resultados |
Modelos de recuperación de información. |
Booleano, espacio vectorial, probabilístico, BM25, Language Models e Relevance Models. |
Evaluación de sistemas de Recuperación de Información. |
Datasets e iniciativas de evaluación. Métricas de eficacia e eficiencia. Training e test. Significancia estadística |
Búsqueda distribuida e social. |
eMeta-buscadores y búsqueda distribuida, blogs, redes sociais, sistemas de recomendación. |