El área de recuperación de información es un campo relacionado con la estructura, análisis, organización, almacenamiento, búsqueda y recuperación de información.
La Recuperación de Información es un área nueva desarrollada en los últimos años.
Puede existir una respuesta "ideal" por parte de un sistema de recuperación de información.
Algunas de las tareas básicas de un SRI son:
Representación lógica de los documentos.
Ranking de los documentos relevantes.
Almacenamiento de una copia del ranking.
Presentación de la respuesta al usuario.
¿Cómo se denomina el conjunto de todos los documentos con los que se trata y sobre los que se deben realizar operaciones de recuperación de información?
Corpus
Colección
Serie
Base de datos textual o documental
¿Que hace falta para realizar operaciones sobre un corpus?
Realizar un análisis de cada elemento antes de realizar una evaluación
Obtener una representación lógica de todos sus documentos
El proceso de indexación que tendrá como resultado una determinadas estructuras de datos (normalmente denominadas algoritmo)
Los sistemas que almacenan y mantienen los documentos se denominan sistemas de recuperación de información referenciales o bibliográficos
El motor de búsqueda es un módulo intermedio entre...
La interfaz y el usuario
El corpus y los indices
La interfaz y los indices
¿Cuál es la diferencia entre recuperación de información y recuperación de datos?
Los objetos que trata uno tienen una estructura bien definida mientras que los del otro se basan generalmente en un documento textual sin estructura
Los atributos de uno tienen una sintaxis basada en esquemas específicos mientras que el otro utiliza esquemas estructurales de base semántica
Las consultas en el area de RD
Cuentan con una estructura bien definida
No son ambiguas
Usan un lenguaje generalista
Consisten en un conjunto de condiciones que deben cumplir los items a evaluar
En este ejemplo que es Saldo_Cuenta? AND Saldo_Cuenta > 10000
Una consulta
Un atributo
Una expresión
Una query
En un sistema de RD los resultados consisten en el conjunto parcial de elementos que satisfacen las condiciones de la query
La consulta en un sistema de RD no admite error alguno
No se puede implementar un sistema de ranking en el area de RD
La relevancia se plantea como similitud y su medida puede estar basada en varios criterios
La relevancia en un juicio subjetivo que puede incluir:
Tratar sobre el tema propuesto
Tener autoridad
Estar actualizado
Aportar información adicional
Satisfacer los objetivos del usuario
Responder a la evaluación subjetiva
La tarea de recuperar información puede ser de dos tipos:
Inmediata y diferida
Específica y completa
Completa y parcial
En una búsqueda ad-hoc el sistema ofrece una interfaz donde la información se estructura en diferenes apartados temáticos.
En la recuperación diferida el usuario tiene un rol pasivo