Desindexar una pagina web

Cómo desindexar una página de google

A menudo, la hinchazón del índice contiene contenido duplicado o causa canibalización de palabras clave. Con varias páginas de un sitio que compiten por la misma intención de búsqueda, los motores de búsqueda no saben qué página es la más relevante, ya que las señales de clasificación se dividen en muchas URL. Esto perjudica la capacidad del sitio para situarse en las primeras posiciones.

«Nuestros algoritmos de calidad examinan el sitio web en su conjunto, por lo que miran todo lo que está indexado. Y si vemos que la mayor parte del contenido indexado es realmente de baja calidad, entonces podríamos decir ‘bueno, tal vez este sitio en general es de baja calidad’. Y si puede decirnos que este contenido de baja calidad no debería ser indexado y no debería ser tenido en cuenta, entonces podemos centrarnos realmente en el material de alta calidad que nos está permitiendo indexar».

Si se acepta la etiqueta, las páginas alternativas (los duplicados de menor valor) se rastrearán pero con mucha menos frecuencia y se excluirán del índice, pasando sus señales de clasificación a la canónica (la página preferida para ser indexada).

¿Cómo se desindexa un sitio web?

Para bloquear definitivamente la indexación de una página, es necesario utilizar una etiqueta meta robots «noindex» o una etiqueta X-Robots. No utilice una directiva noindex en los robots.

¿Qué significa Deindex?

verbo transitivo. eliminar de un índice o de cualquier sistema de indexación, especialmente dejar de ajustar la remuneración en función del coste de la vida.

Índice de Google

Existen varias formas de eliminar el contenido negativo sobre su empresa o sitio web de los resultados de búsqueda. A veces es tan sencillo como retirarlo del sitio del editor original. Sin embargo, hay ocasiones en las que no se puede (o no se quiere) eliminar, pero sí se puede purgar el contenido de los resultados de búsqueda. Cuando esto no funciona o no es una opción, hay veces que el contenido puede ser suprimido.

A menudo, esto se puede lograr con una simple solicitud por correo electrónico al webmaster con una explicación de por qué la información debe ser eliminada y por qué sería en su mejor interés hacerlo. Muchos sitios no sólo se enorgullecen de presentar información objetiva, sino que cuentan con la confianza de sus visitantes y clientes en la validez de sus contenidos, por lo que estarán encantados de eliminarlos para evitar daños a su propia reputación.

Sin embargo, la información puede haber sido republicada en otros sitios de Internet. Así que, aunque el contenido original se haya eliminado, estas otras versiones siguen activas. En estos casos, puede ser necesario tomar otras medidas.

¿Deben indexarse las páginas de destino?

Pero, si bien es cierto que publicar más páginas que sean relevantes para una palabra clave en particular (suponiendo que también sean de alta calidad) mejorará su clasificación para esa palabra clave, a veces es más valioso mantener ciertas páginas de su sitio web fuera del índice de un motor de búsqueda.

¿Por qué no? Porque cualquier persona que encuentre su página de agradecimiento en la búsqueda puede acceder a sus ofertas de generación de clientes potenciales directamente, sin tener que proporcionarle su información para pasar por su formulario de captación de clientes potenciales. Cualquier vendedor que entienda el valor de las páginas de aterrizaje comprende lo importante que es capturar a esos visitantes como clientes potenciales primero, antes de que puedan acceder a sus ofertas.

Y lo que es peor, puede que incluso descubra que algunas de sus páginas de mayor ranking para algunas de sus palabras clave de cola larga podrían ser sus páginas de agradecimiento, lo que significa que podría estar invitando a cientos de clientes potenciales a pasar por alto sus formularios de captación de clientes potenciales. Esa es una razón bastante convincente para querer eliminar algunas de sus páginas web de las SERP.

Una forma de eliminar una página de los resultados de los motores de búsqueda es añadir un archivo robots.txt a su sitio. La ventaja de usar este método es que puedes tener más control sobre lo que estás permitiendo que los bots indexen. ¿El resultado? Puede mantener proactivamente el contenido no deseado fuera de los resultados de búsqueda.

Significado de la desindexación

Quizá piense: «¿Por qué querría ocultar páginas de los motores de búsqueda? Quiero que la gente encuentre mi sitio web de cualquier forma posible: cuantas más páginas, mejor». Pero no siempre es así. En algunas situaciones, es mejor proteger las páginas del sitio web para que no las rastreen los motores de búsqueda. Si su sitio web contiene alguno de los siguientes ejemplos, considere la posibilidad de desindexarlo:

Estos son sólo algunos casos en los que la desindexación de una página web puede ser una buena solución. Ahora se preguntará: «¿Y cómo lo hago?». Hay muchas maneras de bloquear los motores de búsqueda para que no indexen las páginas de su sitio web. Vamos a ver cómo desindexar páginas en HubSpot y WordPress utilizando algunos métodos comunes: robots.txt, etiquetas «noindex» y sitemaps.

Este es un archivo que los sitios web utilizan para comunicarse con los motores de búsqueda y otros robots. Los rastreadores leen el archivo para ver qué páginas deben y no deben indexar. Basta con escribir «Disallow», seguido de dos puntos y un espacio, y luego introducir la URL relativa.

Una etiqueta «noindex» es otro método que se puede utilizar cuando se desea bloquear la indexación de la página web por parte de un motor de búsqueda. Esta etiqueta es una línea de código que puede añadirse al HTML de una página web; debe copiarse en la sección del encabezamiento para que funcione correctamente. La cadena de código se puede encontrar a continuación: