Datos Identificativos | 2024/25 | |||||||||||||
Asignatura | Recuperación de Información e Minería Web | Código | 614G03026 | |||||||||||
Titulación |
|
|||||||||||||
Descriptores | Ciclo | Período | Curso | Tipo | Créditos | |||||||||
Grao | 1º cuadrimestre |
Terceiro | Optativa | 6 | ||||||||||
|
Temas | Subtemas |
Introducción |
Recuperación de Información e Search Engines. Arquitectura dun Search Engine. Grandes retos. |
Recopilación de información. |
Crawling, feeds, web scraping e minería web. |
Procesamento de texto. |
Preprocesamento. Parsing, documentos estructurados, anchor text e análisis de enlaces, internacionalización |
Indices e procesado eficiente. |
Indices Invertidos, compresión, construcción, procesado eficiente de consultas sobre índices invertidos |
Formulación de consultas e presentación de resultados |
Transformación de consultas, relevance feedback, pseudo-feedback, snippets e visualización de resultados. |
Modelos de recuperación de información. |
Booleano, espacio vectorial, probabilístico, BM25, Language Models, Relevance Models, modelos neuronales |
Evaluación de sistemas de Recuperación de Información. |
Datasets e iniciativas de evaluación. Métricas de eficacia e eficiencia. Training e test. Significancia estadística |
Búsqueda distribuida e social. |
Meta-buscadores, búsqueda distribuida e federada, redes sociais, sistemas de recomendación. |