Descripción general |
Esta materia aborda la recuperación de información en repositorios de documentos textuales y el web. Se estudian modelos, técnicas y algoritmos actuales que permiten el crawling, procesamiento, indexación y búsqueda en colecciones de textos del rango de gigabytes, hasta los terabytes de información que se manejan en el web. En esta materia el estudiante comprenderá la arquitectura de los motores de búsqueda de internet usados por las grandes compañías de Search Engines (Google, Bing, Yahoo, Yandex, Baidu, etc) y en las prácticas de la misma podrá desarrollar los módulos principales de un motor de búsqueda. La Recuperación de Información y en particular en el web plantea extraordinarios retos debido al volumen y heterogeneidad de los datos y fuentes y al amplio rango de intereses de usuarios privados y corporativos, por todo ello es un campo con amplias posibilidades de negocio y empleo en informática.
|