Es un complejo concepto de SEO técnico. Consiste en una red de URLs inútiles que
consumen el presupuesto de rastreo o crawl budget que los motores de búsqueda tienen
asignado a una web determinada provocando la no indexación de otras URLs que sí son
útiles.
5 tipos diferentes
Trampa del Calendario
Provocada por calendarios que generan
URLs infinitas (por ejemplo, Marzo del
año 2899)
Se soluciona bloqueando las páginas
del calendario lejanas en el tiempo con
noindex or robots.txt
Trampa de la URL sin final
Provocada por enlaces
relativos generados
automáticamente
Se soluciona evitando
enlaces relativos y
limitando la longitud de
URLs
Trampa de Sesiones
ID
Provocada por URLs
generadas por cada
usuario individual. Suelen
ir acompañadas del
parámetro ‘jsessionid’
Se soluciona eliminando la
creación de estas sesiones únicas.
Otras posibles soluciones pasan
por robots.txt o a través del área
de parámetros de Google Search
Console
Trampa de Navegación
Provocada por los múltiples filtros que
a menudo se encuentra presentes en
tiendas online (color, tamaño...) y que
generan innumerables URLS
Se soluciona excluyendo determinadas
catergorias a través de robots.txt o
reconstruyendo el sitio web con HTML5
en lugar de JS
Alternativamente el uso de etiquetas rel"canonical"
puede ayudar a evitar penalizaciones de Google aunque
los motores de búsquedas seguirán inviertiendo crawl
budget y la spider trap seguirá presente.
Trampa de Búsqueda
Provocada por el motor de
búsqueda interno que genera una
nueva URL para cada búsqueda
Se soluciona añadiendo
noindex, nofollow meta data