Guía DocenteCurso
Facultade de Informática
  Inicio | galego | castellano | A A |  
Mestrado Universitario en Computación
 Asignaturas
  Extracción e Recuperación da Información
Abrir nova vista Vista para imprimir Exportar a pdf
Datos Identificativos 2012/13
Asignatura (*) Extracción e Recuperación da Información Código 614434003
Titulación
Mestrado Universitario en Computación
Descriptores Ciclo Período Curso Tipo Créditos
Mestrado Oficial 1º cuadrimestre
Primeiro Obrigatoria 6
Idioma
Castelán
Galego
Inglés
Prerrequisitos
Departamento Computación
Coordinación
Barreiro Garcia, Álvaro
Correo electrónico
alvaro.barreiro@udc.es
Profesorado
Barreiro Garcia, Álvaro
Blanco Gonzalez, Roi
Vilares Ferro, Jesus
Correo electrónico
alvaro.barreiro@udc.es
roi.blanco@udc.es
jesus.vilares@udc.es
Web http://campusvirtual.udc.es
Descrición xeral DESCRIPCIÓN

Esta asignatura aborda la extracción y recuperación de información sobre repositorios de documentos textuales y sobre la web.

En el caso de la Recuperación de Información (RI), se estudiarán modelos, técnicas y algoritmos que permiten la recopilación, indexación y búsqueda de documentos sobre colecciones de textos que van desde el orden de megabytes y gigabytes, como el caso de los repositorios de documentos, hasta el orden de terabytes, como en el caso de la web.

Por su parte los procesos de Extracción de Información (EI) toman como entrada textos no estructurados y escritos en lenguaje natural, y obtienen a la salida datos no ambiguos representados en un formato definido previamente por el usuario. Los datos extraídos pueden bien ser mostrados directamente al usuario, bien ser almacenados para un análisis posterior, o bien ser utilizados a su vez por los mecanismos de indexación de las aplicaciones de recuperación de información. Las técnicas y algoritmos empleados en tales procesos serán también objeto de estudio en la asignatura.

De este modo mientras que un sistema de RI localiza los documentos relevantes al usuario y los presenta al mismo, los sistemas de EI, previa la especificación de los mismos, buscan reconocer las entidades, localizaciones o eventos referidos en dichos textos, permitiendo así presentarle al usuario aquella información específica en la cual está interesado.

Sin embargo, si bien los procesos de RI y EI facilitan el tratamiento automático de grandes cantidades de información, ninguno de ellos es capaz de facilitar respuestas precisas a preguntas concretas y arbitrarias formuladas por los usuarios ya que dichos sistemas no han sido concebidos para ello. Mientras los sistemas de RI únicamente permiten devolver una lista de documentos supuestamente relevantes con respecto al contenido de la pregunta, debiendo ser el usuario quien la busque, los sistemas de EI no permiten el tratamiento de preguntas arbitrarias, ya que el tipo de información requerida debe haber sido definida por anticipado. Es por ello que surge un tercer tipo de sistemas, los de Búsqueda de Respuestas (BR), los cuales, haciendo uso combinado de técnicas de RI y EI, permiten localizar respuestas concretas en grandes volúmenes de documentos. El estudio de dichos sistemas conforma la parte final de la asignatura.


CONTEXTUALIZACIÓN

En el contexto del Master Universitario de Computación, esta materia permite al estudiante ampliar su formación en el ámbito del procesamiento automático de la información, hasta ahora centrado en casos clásicos de procesamiento de los datos almacenados en registros o bases de datos, para dar paso al tratamiento inteligente de la información contenida en los propios textos y al concepto de biblioteca digital.

Asimismo, por la propia complejidad de este tipo de sistemas, el curso de esta asignatura permitirá al alumno adquirir conocimientos que le ayudarán a diseñar e implementar otros sistemas de naturaleza compleja similar.

Por otra parte, los temas de contenido metodológico le permitirán abordar los aspectos básicos del diseño de experimentos y evaluación, valiosos de por sí tanto para la realización de una tesis doctoral en estos temas como para cualquier ámbito de las ciencias de la computación que incluya componentes experimentales.
(*)A Guía docente é o documento onde se visualiza a proposta académica da UDC. Este documento é público e non se pode modificar, salvo casos excepcionais baixo a revisión do órgano competente dacordo coa normativa vixente que establece o proceso de elaboración de guías
Universidade da Coruña - Rúa Maestranza 9, 15001 A Coruña - Tel. +34 981 16 70 00  Soporte Guías Docentes