Si tu página web no aparece en Google, entonces no existe y es prácticamente invisible. En otras palabras, tu negocio no aparecerá en ningún resultado de búsqueda de los usuarios, y no recibirás nada de tráfico orgánico por parte de la herramienta. Lo que realmente te deja sin relevancia ante tus posibles consumidores.
Cuando alguna persona decide buscar algo en Google, le está pidiendo al buscador que muestre todas las páginas importantes en relación a un índice y debido a que, por lo general, existen millones de páginas que se ajustan a una búsqueda en específico, la competencia se vuelve aún más ruda.
A razón de ello, el algoritmo de Google hace todo lo que puede para ordenar estos resultados en una forma tal, que los mejores vayan primero y los de menor importancia sean consecuentes. Con esto nos referimos a la indexación, cosa que no debe confundirse con el posicionamiento.
Ten en cuenta que hablar de indexar es estar en Google, sin importar la posición en la que aparezca la web de tu negocio. Por otro lado, posicionar, es llegar a los primeros lugares de los resultados de búsqueda.
Que debo hacer si mi sitio web no está indexado
A lo largo de este artículo, daremos respuesta a tres posibles inconvenientes que pueden tener los usuarios en relación a la indexación de su página web. Estos son:
- Todo el sitio web no está indexado
- Solo algunas páginas están indexadas, pero otras no
- Las páginas web que están publicadas no se indexan con la suficiente rapidez
Pero antes, conozcamos algunas definiciones técnicas necesarias para lograr entender el amplio mundo de la indexación y cuales son las posibles soluciones ante este tipo de inconvenientes que pudiera presentar cualquier sitio web.
¿Qué es indexar?
Es la tarea que hace Google de rastrear y descubrir nuevas páginas una vez haya hecho una pequeña búsqueda dentro de la web, y posteriormente, se añaden esas páginas encontradas al índice de resultados. Este procedimiento es posible gracias a una especie de araña web, llamada “Googlebot”.
- Rastrear en la web: es el proceso de seguir una serie de hipervínculos para poder descubrir nuevos contenidos dentro de una página web.
- Araña web: un software especialmente diseñado para poder realizar tareas de rastreo a gran escala.
Dicho esto, vale la pena acotar que en caso de que seas usuario de Google Search Console, puedes obtener una visión mucho más precisa al utilizar el informe de cobertura, en el cual se puede observar el estado de la indexación de tu página web. Solo debes seguir los siguientes pasos:
Ir a Google Search Console > Índice > Cobertura y mirar el número de páginas válidas que están con o sin advertencia.
En caso de que estos resultados sean distintos a cero “0”, quiere decir que Google tiene al menos un par de páginas web indexadas. Por otro lado, de no ser así, debes tomar acciones ya que te está indicando que no tienes web indexada, en absoluto.
Conseguir que Google indexe tu sitio web
Para empezar a estar en Google, es necesario que sigas los siguientes pasos:
- Dirígete a Google Search Console
- Navega en la herramienta de Inspección de URLs
- Copia y pega la URL que deseas que deseas indexar en Google justo en la barra de búsqueda.
- Espera mientras Google compruebe la URL
- Luego, presiona en el botón “Solicitar la indexación”
Lo anterior, es un proceso bastante eficaz cuando se intenta publicar una página o entrada nueva, lo que ocurre, es que estás indicando a Google que has terminado de añadir algo nuevo dentro de tu página web y que está disponible para revisión-
Aunque, es poco probable que con solo solicitar la indexación se resuelvan todos los conflictos derivados de las páginas viejas que Google no logra indexar. Si este es tu caso, sigue las recomendaciones (enlaces rápidos) que dejamos a continuación y prueba si puedes solucionar el inconveniente:
Elimina los bloqueos de rastreo en el archivo robots.txt
Si Google no está indexando tu página podría ser debido a que existe un bloqueo de rastreo en un archivo .txt. Pero no te preocupes, aquí tenemos la solución: lo primero que debes hacer es ingresar a tudominio.com/robots.txt.
Seguidamente, busca cualquiera de estos dos fragmentos de código:
1| User-agent: Googlebot</p>
2| <p>Disallow: /
1| User-agent: *</p>
2| <p>Disallow: /
Ambos códigos alertan al robot de Google acerca de que no tienen el permiso de rastrear ninguna de las páginas del sitio. Y para dar resolución a este inconveniente, solo tienes que eliminarlos y listo, es así de sencillo.
Por otro lado, el bloqueo de rastreo de robots .txt, también podría ser la causa de que no se está indexando una página en particular dentro de Google. Y en caso de que debas comprobar si esto realmente está pasando, lo único que debes hacer es copiar la URL en la inspección de URL ́ s de Google Search Console.
Seguidamente, haz clic en la sección de “cobertura” para obtener los detalles y a continuación, procede a ubicar si está permitido el rastreo. En caso de que la respuesta sea negativa, es porque el sitio está bloqueado por un error de robots.txt”.
Para repararlo, solo debes volver a revisar el archivo robots.txt y buscar una regla de “disallow”, la cual, se encuentra relacionada con el apartado o web correspondiente, procede entonces a eliminar donde sea necesario.
Quita las etiquetas noindex
En este caso, es importante que sepas que si no le indicas a Google que deseas indexar una página, este no lo hará. Lo que resulta bastante útil para las páginas que desean estar en modo privado, ahora bien, existen un par de formas de hacerlo:
Modo 1: utilizando metaetiqueta
Cualquier página que contenga estas metaetiquetas dentro de su sección <head>, no podrán ser indexadas por Google:
1| &lt;meta name=“robots” content=“noindex”&gt;
1| &lt;meta name=“googlebot” content=“noindex”&gt;
Se trata de una metaetiqueta de robots, que indica a los motores de búsqueda si pueden indexar la página, o no. Para poder encontrar las páginas utilizando una metaetiqueta noindex en tu web, se debe ejecutar el rastreo en Ahrefs’ Site Audit.
Solo debes chequear el informe de “Indexability” y posteriormente buscar la advertencias de “Noindex page”. Acto seguido, tienes que hacer clic para ver las páginas que han sido afectadas por la metaetiqueta y retirarla de cualquier página, en la que no queremos que esté.
Modo 2: X‑Robots-Tag
En este caso, los rastreadores también aceptan el encabezado HTTP X‑Robots-Tag, el cual, se puede implementar a través del lenguaje de script junto al servidor como PHP. O en dado caso, hacerlo en tu archivo .htaccess, o modificando la configuración de tu servidor.
En el mismo orden de ideas, la herramienta de inspección en Search Console indica al usuario si Google tiene bloqueada una página por su tipo de encabezado. Lo que se debe hacer es colocar la URL y luego buscar si permite la indexación.
Para comprobar que la página está dando este error, se debe ejecutar un rastreo con Ahrefs´s Site Audit Tool o en español auditoría del sitio. Seguidamente, se incorpora el filtro “Robots information in HTTP header” en Page Explorer.
Luego de esto, pide a tu programador que impida que las web que se deben indexar tengan esta cabecera.
Quita las etiquetas canónicas maliciosas
Esta forma de indexar una página, es cuando un tipo de etiqueta canónica le comunica a Google, cual es la versión que prefiere una página. Entonces, quedaría algo como esto:
<link rel=“canonical” href=“/page.html”/>
En la mayoría de las páginas podemos encontrar que, o no tienen una etiqueta canónica o poseen una autorreferencia de etiqueta canónica. Lo anterior, le dice a Google que la página es la preferida y seguramente, la única en esa versión. Es decir, expresa que tú deseas que esa página sea indexada.
Aunque si tu web contiene una etiqueta canónica maliciosa, podrías estar indicando a Google acerca de una versión de esta página preferida que no existe. En dado caso, tu sitio web no se indexara.
Para que logres corroborar que hay una etiqueta canónica, debes utilizar la herramienta de inspección de URL´s de Google. Una vez allí, se te mostrará la advertencia de “página alternativa con etiqueta canónica”, en dado caso que la canónica dirija a otra página.
Importante
Ten presente que las etiquetas canónicas no siempre son malas, solo que la mayoría de páginas que conservan esta etiqueta las tienen por una razón. Si observas que tu página tiene un conjunto canónico, entonces verifícala. Entonces, si esa versión es la preferida dentro de la página, no tendrías necesidad de indexar el sitio en cuestión.
Si deseas encontrar las etiquetas canónicas de una forma rápida, debes ejecutar un en Ahrefs’ Audit Tool.
Comprueba que la página no esté huérfana
Cuando hablamos de páginas huérfanas, nos referimos a las web que no tienen enlaces internos que apuntan hacia ellas mismas. Lo importante es entender que Google descubre nuevo contenido mediante el rastreo web, las páginas huérfanas no entran en la lista mediante estos procesos.
Para lograr comprobar si existen páginas huérfanas, se puede realizar el rastreo con Ahrefs’ Site Audit. Una vez allí, revisa los enlaces entrantes o “incoming likes”, todos los errores de las páginas huérfanas o conocidas por su nombre en inglés, “Orphan page”.
Importante
El proceso de comprobar cuando una página web es huérfana, solo funciona cuando ocurren cualquiera de estas dos cosas:
- Cada una de las páginas que quieres indexar están dentro de tu sitemap
- Se han seleccionado las casillas correspondientes para usar la página dentro del sitemap como punto de inicio para el rastreo con configuración Ahrefs’ Site Audit.
¿No estás seguro que las páginas que deseas indexar están dentro de tu sitemap? Intenta con lo siguiente:
- Mediante tu CMS, descarga la lista de las páginas que están en tu sitio
- Utilizando herramientas como Ahrefs’ Site Audit, rastreo la página web
- Trabaja en hacer un referencia cruzada de las dos URL´s
- Si no encuentras un URL durante el proceso de rastreo, quiere decir que es una página huérfana
Las páginas huérfanas, se pueden corregir de dos maneras:
- En caso de que la página no sea relevante, borrala y quitala de tu sitemap
- En caso de que sea importante la página, sumala a la estructura de enlaces internos en tu web
Construye backlinks de alta calidad
Cada backlink le dice a Google cuando un sitio web es de relevancia, porque después de todo si el usuario está solicitando enlazarla es porque tiene de seguro algún tipo de valor. Recordemos que, este tipo de páginas son las que Google prefiere indexar.
Con la finalidad de ser totalmente transparente, Google no solo puede indexar web con backlinks, sino también millones de páginas que no lo poseen. A pesar de ello, Google se fija primero en los sitios que ofrecen enlaces de gran calidad, importantes y las rastrean.
Posicionamiento no es indexación
Que una web o sitio este indexado en Google, no quiere decir necesariamente que tenga tráfico o posicionamiento. Ambos términos son dos cosas muy diferentes, la indexación significa que Google ya sabe que tu página existe, pero no quiere decir que lo vaya a posicionar en los resultados de consultas como propuesta útil.
Aquí es donde entra en juego el SEO, lo cual es el arte de optimización de forma orgánica de páginas para aparecer en los primeros lugares de búsquedas y consultas específicas. En líneas generales, las estrategias de optimización SEO incluye lo siguiente:
- Identificar lo que buscan los clientes
- Crear contenido en relación a los intereses y temas de los usuarios
- Definir las palabras claves objetivas
- Construir backlinks
- Crear contenido de forma regular para mantener fresca la web