| Datos Identificativos | 2019/20 | |||||||||||||
| Asignatura | Recuperación da Información | Código | 614G01040 | |||||||||||
| Titulación |
|
|||||||||||||
| Descriptores | Ciclo | Período | Curso | Tipo | Créditos | |||||||||
| Grao | 2º cuadrimestre |
Terceiro | Optativa | 6 | ||||||||||
|
||||||||||||||
| Temas | Subtemas |
| Introducción |
Recuperación de Información e Search Engines. Arquitectura dun Search Engine. Grandes retos. |
| Recopilación de información. |
Crawling e feeds. |
| Procesamento de texto. |
Preprocesamento. Parsing, documentos estructurados, anchor text e análisis de enlaces, internacionalización |
| Indices e procesado eficiente. |
Indices Invertidos, compresión, construcción, procesado eficiente de consultas sobre índices invertidos |
| Formulación de consultas e presentación de resultados |
Transformación de consultas, relevance feedback, pseudo-feedback, snippets e visualización de resultados |
| Modelos de recuperación de información. |
Booleano, espacio vectorial, probabilístico, BM25, Language Models e Relevance Models. |
| Evaluación de sistemas de Recuperación de Información. |
Datasets e iniciativas de evaluación. Métricas de eficacia e eficiencia. Training e test. Significancia estadística |
| Búsqueda distribuida e social. |
eMeta-buscadores y búsqueda distribuida, blogs, redes sociais, sistemas de recomendación. |