Dentro de RI, o usuário precisa traduzir sua necessidade de informação em uma consulta na
linguagem fornecida pelo sistema, já que, em um sistema de RI, como uma máquina de busca, isso
geralmente implica na especificação de um conjunto de palavras que transmitam a semântica da
necessidade de informação.
O objetivo principal de um sistema de RI recuperar todos os documentos que são relevantes à
necessidade de informação do usuário e, ao mesmo tempo, recuperar o menor número possível
de documentos irrelevantes.
Um SRI enfrenta o problema que é a a dificuldade é saber não só como extrair a informação
dos documentos, mas também saber como utilizá-la para decidir quanto à sua relevância.
A representação lógica dos documentos em um SRI pode ser feita a partir de todos os termos do documento, ou
considerando-se apenas termos selecionados por especialistas humanos chamados de vocabulário controlado.
Modelos clássicos de RI
Modelo Booleano
Uma consulta em um modelo booleano é composta por termos de indexação
ligados por três conectivos Booleanos: not, and e or.
Modelo propabilístico
Ordenar os documentos recuperados de forma decrescente de acordo com esse grau de
similaridade; Propõe um método em que casamentos parciais entreconsultas e documentos
são possíveis (algo entre 0 e 1). (BAEZA-YATES; RIBEIRO-NETO, 2013, p. 29)
Modelo vetorial
Neste modelo, a ordenação dos documentos é calculada pesando dinamicamente
os termos da consulta relativa aos documentos e baseia-se no princípio da
ordenação probabilística.
O processo de RI é a tarefa de encontrar documentos relevantes que atendam
às necessidades de informação de um usuário. O primeiro passo é definir o
que é o documento a ser recuperado, definir a forma de consulta, definir o
subconjunto de respostas e por último, definir a forma de apresentação do
resultado.
Diretórios
São usados pra organizar e localizar recursos da web e sua principal função é fazer com que o
usuário encontre, com mais facilidade, os sites no qual deseja buscando por categorias em vez de
palavras-chave.
Metabuscadores
Metabuscadores se tratam de programas que irão procurar a palavra solicitada em vários
mecanismos de busca e diretórios simultaneamente.
Metadados
Os metadados são marcos ou pontos de referência que permitem circunscrever a informação sob
todas as formas, pode se dizer resumos de informações sobre a forma ou conteúdo de uma fonte.
A RI trata da representação, armazenamento, organização e acesso a itens de informação,
como documentos,páginas Web, catálogos online, registros estruturados e semiestruturados,
objetos multimídia etc.
estratégias, recursos e filtros de busca
No âmbito da recuperação da informação, a estratégia de busca pode ser definida como uma técnica
ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação
armazenada em uma base de dados. (LOPES, 2002)
Os recursos de busca são as aspas, truncamento e os parênteses que, quando usados, refinam a
busca para o usuário.
Os filtros de busca se localizam em alguma parte da página em que o usuário está fazendo a busca, e nela
há opções que ajudam a refinar a busca.
Avaliação de RI - revocação e precisão
Revocação = capacidade de oferecer, em resposta a uma questão, todas as referências relevantes
existentes na base de dados. Esta é uma questão controvertida.
Precisão = capacidade de fornecer apenas referências relevantes, eliminando as que não são
relevantes para a questão proposta.
Motores de
busca
Motores de busca são conjuntos de softwares cogitados para encontrar informações armazenadas
em um sistema computacional a partir de palavras-chave indicadas pelo usuário ou utilizador que
reduzindo o tempo necessário para encontrar informações.
RI na Web: especificidades/ características e arquitetura dos sistemas
A internet é uma rede. É um conjunto de inúmeras redes, conectadas entre si, que permite a
comunicação, partilha de informações e programas entre seus usuários.
Possui dados estimados na ordem de petabytes. Pode ser explorado por busca em maquinas de
busca ou por navegação.
Muitas máquinas de busca usam uma arquitetura centralizada em coletor-indexador. Coletores são
programas (agentes de software) que percorrem a web enviando páginas novas ou atualizadas ao
servidor principal no qual elas são indexadas.