Zusammenfassung der Ressource
Spider Trap
- Es un complejo concepto de SEO técnico. Consiste en una red de URLs inútiles que
consumen el presupuesto de rastreo o crawl budget que los motores de búsqueda tienen
asignado a una web determinada provocando la no indexación de otras URLs que sí son
útiles.
- 5 tipos diferentes
- Trampa del Calendario
- Provocada por calendarios que generan
URLs infinitas (por ejemplo, Marzo del
año 2899)
- Se soluciona bloqueando las páginas
del calendario lejanas en el tiempo con
noindex or robots.txt
- Trampa de la URL sin final
- Provocada por enlaces
relativos generados
automáticamente
- Se soluciona evitando
enlaces relativos y
limitando la longitud de
URLs
- Trampa de Sesiones
ID
- Provocada por URLs
generadas por cada
usuario individual. Suelen
ir acompañadas del
parámetro ‘jsessionid’
- Se soluciona eliminando la
creación de estas sesiones únicas.
Otras posibles soluciones pasan
por robots.txt o a través del área
de parámetros de Google Search
Console
- Trampa de Navegación
- Provocada por los múltiples filtros que
a menudo se encuentra presentes en
tiendas online (color, tamaño...) y que
generan innumerables URLS
- Se soluciona excluyendo determinadas
catergorias a través de robots.txt o
reconstruyendo el sitio web con HTML5
en lugar de JS
- Alternativamente el uso de etiquetas rel"canonical"
puede ayudar a evitar penalizaciones de Google aunque
los motores de búsquedas seguirán inviertiendo crawl
budget y la spider trap seguirá presente.
- Trampa de Búsqueda
- Provocada por el motor de
búsqueda interno que genera una
nueva URL para cada búsqueda
- Se soluciona añadiendo
noindex, nofollow meta data