Zusammenfassung der Ressource
Los contenidos
profundos de la web
- Google y los demás
buscadores generalistas no
pueden rastrear toda la
información que existe en la
web
- Hay una enorme cantidad de contenidos que
no están indexados por los motores de
búsqueda:
- Es lo que se conoce con varios términos:
- internet profunda
- web invisible
- deepnet
- hidden web
- Se trata de archivos a los
que los robots de los
buscadores no llegan
- y de los que por tanto no
pueden guardar copia
- ni indexar sus textos
- ni facilitar resultados
cuando consultas.
- Causas
- Generada dinámicamente en bases de datos, sin páginas ni URL estables.
- Hospedada bajo interfaces y sistemas de búsqueda propios.
- Disponible sólo mediante registro personal, nombre de usuario, contraseña, etc.
- De pago, mediante suscripción, licencia, pago por uso, etc.
- Bajo formatos o tecnologías especiales, multimedia, etc., no páginas html.
- Restringida a los robots de los buscadores por diversas razones y métodos.
- Incluye todo tipo de
materiales.
- Algunos son información científica valiosa y de interés.