Cómo analizar el sitemap en Screaming Frog
Screaming Frog es un rastreador potente con el que podemos auditar nuestro sitemap (mapa del sitio) y asegurarnos de que todas las URLs que queremos indexar cumplan unos mínimos. En esta clase te explico cómo haberlo fácilmente.
Por qué rastrear el sitemap
Antes de ponernos manos a la obra, vamos a comprender por qué deberíamos analizar nuestros mapas del sitio. Y para ello, aquí te dejo 3 razones:
- Cobertura Completa: nos aseguramos que todas las URLs listadas en el sitemap sean rastreadas, incluyendo aquellas que podrían no ser descubiertas a través de la navegación normal del sitio (huérfanas).
- Eficiencia: hacemos que Screaming Frog se centre en las URLs que consideramos importantes, potencialmente reduciendo el tiempo de rastreo.
- Detección de Errores: facilitamos la identificación de discrepancias entre las URLs listadas en el sitemap y las que Screaming Frog puede encontrar a través de la navegación, ayudando a detectar problemas de acceso o enlaces rotos.
Cómo incluir el sitemap en el rastreo
Incluir el rastreo de nuestro mapa del sitio es bien, sencillo. Solo tenemos que ir a Configuración del rastreo > Spider > Rastreo, y en la parte inferior marcar la opción de Rastrear sitemap XML enlazados.
Tras ello, solo tenemos que elegir que opción queremos usar:
- Descubrir automáticamente los sitemaps a través de Robot.txt (el cual lo indica bien arriba).
- Rastrear sitemaps que nosotros le indiquemos.
Realmente las 2 opciones de abajo no son excluyentes y puedes combinarlas. Por ejemplo en un sitio web grande, con varios sitemaps, puedes especificar en el cuadro de abajo el sitemap o sitemaps que quieras analizar:
Análisis de los resultados
Una vez realizado el rastro podemos analizar los resultado yendo a la pestaña específicas de Sitemaps. Así mismo, en el menú lateral derecho tenemos un resumen, que podemos usar también a modo de filtro a la derecha del todo, justo encima de las URLs.
A través del filtro antes mencionado podemos ver:
- Las URLs que se encuentran en el sitemap: Estas URLs están específicamente listadas en el archivo sitemap para ser rastreadas por los motores de búsqueda.
- Las URLs que no se encuentran en el sitemap: Son páginas del sitio web que no han sido incluidas en el archivo sitemap, posiblemente por ser menos prioritarias o recién creadas.
- Las URLs huérfanas: Son páginas que no están enlazadas desde ninguna otra parte del sitio web, haciendo que los motores de búsqueda tengan dificultades para encontrarlas.
- Las URL no indexables que se encuentran en el sitemap: A pesar de estar listadas en el sitemap, estas URLs están marcadas para no ser indexadas por los motores de búsqueda, usualmente mediante la etiqueta meta robots.
- Las URLs que se encuentran en varios sitemaps: Son páginas que han sido listadas en más de un archivo sitemap, lo cual puede ser útil para sitios grandes con múltiples categorías o secciones.
Así mismo, también podemos encontrar sitemaas con más de 50.000 URLs y sitempa pesados, de más de 50MB
Si has llegado hasta aquí… ¡Apúntate a mi Newsletter y sigue aprendiendo cada semana sobre SEO!
Deja una respuesta