¿Deseas aprender qué son las etiquetas canonical y cómo utilizarlas para evitar los temidos inconvenientes de contenido duplicado?
Las etiquetas canonical no son nada nuevo. Han estado por ahí.
Google, Microsoft y Yahoo se unieron para crearlas. ¿Su objetivo? Suministrar a los propietarios de sitios web una forma de solucionar los problemas de contenido copiado de forma rápida y sencilla.
¿Funcionan? Sí, perfectamente… ¡pero sólo si sabes cómo usarlas!
En esta guía, aprenderás:
Una etiqueta canonical (rel=“canonical”) es un fragmento de código HTML que define la versión principal para páginas duplicadas, casi duplicadas y afines. En otras palabras, si tienes exactamente el mismo (o afín) contenido disponible en diferentes URLs, puedes utilizar etiquetas canonical para especificar qué versión es la principal y por ende, la que debería ser indizada.
Las etiquetas canonical usan una sintaxis simple y consistente, y se sitúan en la sección <head> de una página web:
<link rel=“canonical” href=“/pagina-ejemplo/” />
Esto es lo que significa cada una parte de ese código:
A Google no le agrada el contenido copiado. Hace que sea más difícil para ellos elegir:
Demasiado contenido duplicado también puede afectar a tu “crawl budget”. Esto significa que Google puede acabar perdiendo el tiempo rastreando múltiples versiones de la misma página en lugar de descubrir otro contenido esencial en tu sitio.
La verdad sobre el crawl budget
Obligar a Google a perder el tiempo rastreando contenido duplicado es lógicamente algo que debe evitarse en lo posible. No obstante, Google afirma que no es un problema para la mayoría de los sitios.
Si las nuevas páginas tienden a ser rastreadas exactamente el mismo día de su publicación, el crawl budget no es algo en lo que los webmasters deban centrarse. De igual modo, si un sitio tiene menos de unas pocas miles de URLs, la mayoría de las veces se rastreará de forma eficiente.
Las etiquetas canonical resuelven todos estos problemas. Dejan indicar a Google qué versión de una página deben indexar y posicionar, y dónde afianzar “link equity”.
Si no se especifica una URL canonical, Google se encargará de estos asuntos .
Si no señalas una URL canonical, identificaremos lo que creemos que es la mejor versión o URL.
Confiar en Google así no es una enorme idea; es posible que escojan una versión de tu página que no desees que sea canonical.
Google que ellos usualmente respetan la URL canonical que configuras, pero no siempre y en toda circunstancia. Esto es pues las etiquetas canonical son pistas, no directivas. Siempre y cuando se respeten, cualquier señal como los links, deberían consolidarse en la URL canonical.
Ejecutar buenas prácticas de etiquetas canonical también ayuda a atenuar el riesgo de que Google vea una versión no deseada de la página como canonical.
Dado que probablemente no has estado publicando las mismas entradas y páginas múltiples veces, es fácil aceptar que tu sitio no tiene contenido duplicado.
Pero los motores de búsqueda rastrean las URLs, no las páginas web.
Esto quiere decir que ven
ejemplo.com/producto y
ejemplo.com/producto?color=red como páginas únicas, si bien sean exactamente la misma página web con contenido idéntico o bien similar.
Se denominan URLs parametrizadas y son una causa común de contenido copiado, especialmente en sitios de con navegación facetada/filtrada.
Por ejemplo,
Brown Bag Clothing vende camisetas. Esta es la URL para su:
/en-gb/clothing/shirts.html
Si filtras sólo para camisetas XL, se añade un parámetro a la URL:
/en-gb/clothing/shirts.html
?Size=XL
Si entonces también aplicas el filtro sólo para camisetas azules, se añade otro parámetro:
/en-gb/clothing/shirts.html
?Size=XL&color=Blue
Todas estas son páginas separadas a los ojos de Google, si bien el contenido sea sólo marginalmente diferente.
Pero no son sólo los sitios de comercio electrónico los que caen víctimas de contenido duplicado.
Aquí hay otras causas comunes de contenido duplicado que se aplican a todos los tipos de sitios web:
En estas situaciones, el empleo adecuado de las etiquetas canonical es vital.
Además, los problemas de contenido copiado entre dominios cruzados también son un problema. Si estás sindicando contenido, la mejor práctica es usar una etiqueta canonical autorreferencial en tu artículo y hacer que el contenido sindicado señale tu versión como la canonical con una etiqueta canonical de un dominio a otro.
Esto no siempre y en todo momento impide que el contenido sindicado aparezca en los resultados de búsqueda, mas ayuda a reducir el riesgo de superar a la original.
(Si la gente elige de manera deliberada sindicar su contenido, se hace difícil identificar la fuente de origen. Por eso aconsejamos el empleo de canonicals o el bloqueo. Los editores pueden exigirlo).
Algunos sitios se negarán a añadir un enlace canonical. En semejantes casos, depende de ti si quieres correr el riesgo.
Las etiquetas canonical son fáciles de incorporar. Discutiremos 4 maneras diferentes de hacerlo en un momento. No importa el método que escojas, hay 5 reglas de oro que deberías rememorar en todo instante.
John Mueller de Google asevera que es buena práctica no utilizar caminos relativos con el elemento de link rel=“canonical”.
(Puedes usar cualquiera de los 2, mas te recomiendo que emplees las URLs absolutas para que estés seguro de que se interpretan adecuadamente).
Así que deberías utilizar la próxima estructura:
<link rel=“canonical” href=“
/ejemplo-pagina/” />
Al contrario de:
<link rel=“canonical” href=”
/ejemplo-pagina/” />
Dado que Google puede tratar las URLs en mayúsculas y en minúsculas como dos URL diferentes, primero debes asegurarte de y entonces usar URLs en minúsculas para tus etiquetas canonical.
Si has cambiado a SSL, asegúrate de no declarar ninguna URL no-SSL (es decir, HTTP) en tus etiquetas canonical. Hacerlo puede teóricamente llevar a confusión y a resultados inesperados. Si estás en un dominio seguro, asegúrate de emplear la siguiente versión de tu URL:
<link rel=“canonical” href=“
https://ejemplo.com/ejemplo-pagina/” />
Al contrario de:
<link rel=“canonical” href=“
http://ejemplo.com/ejemplo-pagina/” />
Si no estás usando HTTPS entonces haz lo opuesto.
John Mueller de Google afirma que aunque no es obligatorio, las etiquetas canonical autorreferenciales son.
Recomiendo [usar una] canonical autorreferencial porque realmente nos deja en claro qué página deseas que se indexe, o bien cuál debería ser la URL cuando se indexe.
Incluso si tienes una página, a veces hay diferentes alteraciones de URLs que pueden hacer que esa página cambie. Por ejemplo, con parámetros al final, quizás con mayúsculas y minúsculas o www y no www. Todas y cada una estas cosas pueden ser solucionadas con una etiqueta canonical.
En caso de que no estés seguro de cómo funciona una canonical autorreferencial, se trata básicamente de una etiqueta canonical en una página que apunta a sí misma. Por servirnos de un ejemplo, si la URL fuera
/ejemplo-pagina, entonces una canonical autorreferencial en esa página sería:
<link rel=“canonical” href=“/ejemplo-pagina” />
La mayoría de los Content Management System modernos y populares añaden automáticamente URLs autorreferenciales, mas necesitarás que tu desarrollador lo codifique si usas un CMS adaptado.
Si una página tiene múltiples etiquetas canonical,.
En caso de que haya múltiples declaraciones de rel=canonical, es probable que Google ignore todos esos indicios de rel=canonical.
Hay 5 formas conocidas de concretar URLs canonical. Estas son las llamadas señales de canonicalización:
Para inconvenientes y ventajas de cada método, mira la.
El empleo de una etiqueta rel=canonical es la manera más simple y obvia de detallar una URL canonical.
Simplemente añade el siguiente código a la sección <head> de cualquier página duplicada
<link rel=“canonical” href=“/pagina-canonical/” />
Digamos que tienes un sitio de ecommerce de venta de camisetas. Quieres que
/camisetas/camisetas-negras/ sea la URL canonical, aún cuando el contenido de esa página sea alcanzable a través de otras URLs (por servirnos de un ejemplo,
/ofertas/camisetas-negras/)
Simplemente añade la próxima etiqueta canonical a cualquier página duplicada:
<link rel=“canonical” href=“/camisetas/camisetas-negras/” />
Ten en cuenta que si estás utilizando un CMS, no es necesario que te metas con el código de tu página. Hay una forma más fácil.
Instala y las etiquetas canonical autorreferenciales se añadirán automáticamente. Para establecer canonicals adaptados usa la sección “Avanzado” en todos y cada post o página.
Shopify añade de forma predeterminada URLs canonical autorreferenciales para productos y publicaciones de blog. Para establecer URLs canonical adaptadas necesitarás editar los ficheros de la plantilla (.liquid) de forma directa.
tiene algo de información sobre cómo hacerlo.
Squarespace añade también, por defecto, URLs autorreferenciales. Pero, como en el caso de Shopify, necesitas editar el código directamente si quieres añadir una URL canonical personalizada.
Para documentos como PDFs no hay forma de colocar etiquetas canonical en la cabecera de una página por el hecho de que no hay una sección <head> en una página. En tales casos, necesitarás emplear el HTTP header para establecer las canonicals. Puedes también utilizar una canonical en HTTP header de páginas web estándar.
Imagina que creamos una versión PDF de este artículo y lo situamos en una subcarpeta de nuestro weblog (ahrefs.com/blog/*).
Así es cómo se vería nuestra cabecera HTTP para ese archivo:
Content-Type: application/pdf
Link: </blog/canonical-tags/>; rel=“canonical”
Lectura recomendada
:
(en inglés)
Google que las páginas no-canonical
no deberían ser incluidas en sitemaps. Sólo las URLs canonical deberían estar listadas. Esto es así por el hecho de que Google comprende a las páginas listadas en el sitemap como canonicals sugeridas.
De todas formas. No siempre y en todo momento seleccionarán URLs en sitemaps como canonicals.
No garantizamos que consideremos a las URLs de los sitemaps como canonicals, pero es una forma sencilla de definirlas para un lugar grande, y los sitemaps son una forma útil de apuntar a Google qué páginas consideras más esenciales en tu lugar.
Utiliza redirecciones trescientos uno cuando desees desviar el tráfico de una URL duplicada y hacia la versión canonical.
Supón que se puede acceder a tu página a través de estas URLs:
Elige una URL como la canonical y redirecciona las otras URLs cara allí.
Deberías hacer lo mismo para asegurar las versiones HTTPS/HTTP y www/no-www de tu lugar. Escoge una versión canonical y redirecciona las otras hacia ella.
Por ejemplo, la versión canonical de
ahrefs.com es la URL con HTTPS y no-www (
). Todas y cada una las siguientes URLs redireccionan cara allí:
Lee
.
La forma en que se enlaza de una página a otra a través de tu lugar es una señal de canonicalización.
El administradores web analista de tendencias de Google, John Mueller, cubre las señales utilizadas para determinar las URLs canonical en:
Cuanto más consistente seas con todas y cada una estas señales, más fácil será para los motores de búsqueda determinar tu URL canonical preferida. Tal como menciona John en el vídeo, Google también tiene preferencia por las URLs HTTPS sobre las HTTP, y por las URLs más bonitas.
La canonicalización es de alguna forma un tópico complejo. Como tal, hay muchos malentendidos y conceptos erróneos sobre cómo canonicalizar correctamente.
Aquí hay algunos fallos comunes que la gente comete al intentar hacerlo:
Bloquear una URL en impide que Google lo rastree, lo que significa que no podrán ver ninguna etiqueta canonical en esa página. Esto, por su parte, impide que transfieran “link equity” de la página no-canonical a la canonical.
Nunca mezcles noindex y rel=canonical. Son instrucciones contradictorias.
Google acostumbra a dar prioridad a la etiqueta canonical sobre la etiqueta ‘noindex’, como asevera John Mueller. Mas sigue siendo una mala práctica. Si no quieres indexar y al unísono canonicalizar una URL, emplea una redirección trescientos uno. De lo contrario, utiliza rel=canonical.
Establecer un código de estado HTTP 4XX para una URL canonicalizada tiene el mismo efecto que usar la etiqueta ‘noindex’: Google no podrá ver la etiqueta canonical y transferirá “link equity” a la versión canonical.
Las páginas paginadas no han de ser canonicalizadas a la primera página paginada de la serie. En su sitio, se deben utilizar canonicals autorreferenciales en todas y cada una de las páginas paginadas.
¿Por qué? Como John Mueller de Google, este es un empleo inapropiado de la rel=canonical.
Ya que este post es sobre la canonicalización, lo primordial que hay que evitar es utilizar rel=canonical en la página 2 que apunta a la página 1. La página 2 no es equivalente a la página 1, por lo que el uso de rel=canonical de esta forma sería incorrecto.
También deberías usar etiquetas rel=prev/next para la paginación. Estas, mas.
se usan para detallar el idioma y el propósito geográfico de una página web.
Google que cuando se usa hreflang, se debe “especificar una página canonical en el mismo idioma, o el mejor idioma substituto posible si no existe una canonical para exactamente el mismo idioma”.
El hecho de tener múltiples etiquetas rel=canonicals hará que probablemente sean ignoradas por Google. En muchos casos esto ocurre porque las etiquetas se insertan en un sistema en diferentes puntos como por servirnos de un ejemplo por el CMS, el tema, y el/los plugin(s). Es precisamente por esto que muchos complementos tienen una opción de sobreescritura para asegurarse de que son la única fuente de etiquetas canonical.
Otra área en la que esto puede ser un problema es en las canonicals añadidas con JavaScript. Si no tienes una URL canonical especificada en la respuesta HTML y después añades una etiqueta rel=canonical con JavaScript entonces debería ser respetada cuando Google renderice la página. No obstante, si tienes una canonical detallada en HTML y también intercambias la versión preferida con JavaScript, estás mandando señales confusas a Google.
Rel=canonical debería aparecer solo en la <head> de un documento. Una etiqueta canonical en la sección <body> de una página será ignorada.
Donde esto puede convertirse en un problema es con el análisis sintáctico de un documento. Al paso que el código fuente de una página puede tener la etiqueta rel=canonical en la ubicación adecuada, cuando la página se construye verdaderamente en un navegador o bien se renderiza por un motor de búsqueda, muchas cosas diferentes como etiquetas no cerradas, JavaScript inyectado, o bien <iframes> en la sección <head> pueden ocasionar que el <head> termine prematuramente mientras se renderiza. En estos casos, una etiqueta canonical puede ser accidentariamente lanzada al <body> de una página renderizada donde no será respetada.
Es fácil cometer errores con la canonicalización, con lo que merece la pena auditar de forma regular tu sitio web para los problemas relacionados con las etiquetas canonical y arreglarlos lo antes posible.
Para ello, puede emplear la.
Site Audit rastrea tu sitio por más de 100 inconvenientes posicionamiento en buscadores, incluyendo aquellos relacionados con las etiquetas canonical.
Aquí hay 12 problemas relacionados con el etiquetado canonical que Site Audit puede localizar, y cómo arreglarlos:
Esta advertencia se activa en el momento en que una o más páginas son canonicalizadas a una URL 4XX.
Los motores de búsqueda no indexan páginas 4XX porque no marchan. Como resultado, ignoran cualquier etiqueta canonical que apunte a tales páginas y de manera frecuente acaban indexando la versión incorrecta (no canonical) de la página.
Revisa las páginas perjudicadas y sustituye los links canonicals muertos (4XX) por links a páginas que funcionen (doscientos) que desees indexar.
Esta advertencia se activa en el momento en que una o más páginas son canonicalizadas a una URL 5XX.
Los códigos de estado HTTP 5XX señalan problemas en el consultoria analitica web , que dan como resultado una página canonical inaccesible. No es muy probable que Google indexe páginas inaccesibles, por lo que podría ignorar el código canonical.
Reemplazar cualquier URL canonical errónea con URL válidas. Verifica si hay configuraciones erróneas en el servidor si el canonical concretado semeja adecuado. Ten presente que esto puede ser un inconveniente temporal si el rastreo se generó cuando tu lugar se estaba caído por mantenimiento o el servidor de tu lugar estaba sobrecargado.
Esta advertencia se activa cuando una o bien más páginas son canonicalizadas a una URL redireccionada.
Las canonicals deben siempre y en toda circunstancia señalar la versión con mayor autoridad de una página. Este no es el caso con la redirección de URLs. Como resultado, los motores de búsqueda pueden malinterpretar o ignorar la etiqueta.
Reemplazar los links canonicals por links directos a la versión con mayor autoridad de la página (es decir, una que devuelva un código de estado HTTP 200 y no redireccione).
Esta advertencia se activa cuando existen una o bien más páginas duplicadas o bien muy similares que no detallan una versión canonical.
Dado que no se especifica ninguna canonical, Google intentará identificar la versión más conveniente para mostrarla en los propios resultados de búsqueda. Posiblemente esta no sea la versión que deseas indexar.
Revisa los conjuntos de duplicados. Escoge una versión canonical que debería ser indexada en los resultados de búsqueda. Detalla ésta como la versión canonical en todos los duplicados (y añade una etiqueta canonical autorreferencial a la versión canonical).
Esta advertencia se activa en el momento en que una o bien más páginas detallan una URL no canonical en sus anotaciones de hreflang.
Los links en las etiquetas hreflang
siempre deben apuntar a las páginas canonicals. Enlazar a una versión no-canonical de una página desde las anotaciones de hreflang puede confundir y despistar a los motores de búsqueda.
Sustituir los links en las anotaciones de hreflang de las páginas afectadas por su canonical.
Esta advertencia se activa cuando una o bien más URLs canonical concretadas no tienen enlaces entrantes internos.
Las URLs canonical sin links internos son inalcanzables para los visitantes del sitio web. En algún lugar del sitio se las dirige a una versión no-canonical de la página en su lugar.
Reemplazar cualquier link interno a páginas canonicalizadas con enlaces directos a la canonical.
Esta advertencia se activa cuando una o más páginas no-canonical aparecen en el sitemap.
Google establece que no debes incluir URLs no-canonical en tu sitemap; la razón es que ven las páginas de los sitemaps como sugerencias canonical. Sólo deberías incluir en los sitemaps las páginas que desees que se indexen.
Elimina URLs no-canonical de tu sitemap..
Esta advertencia se activa en el momento en que una o más páginas especifican una URL canonical que también es canonicalizada a una página diferente. Esto crea una “cadena de canonicals” en la que la página A es canonicalizada a la página B, que por su parte es canonicalizada a la página C.
Las cadenas canonicals pueden confundir y engañar a los motores de búsqueda. agencias diseño , pueden malinterpretar o ignorar sus especificaciones.
Sustituir los enlaces no canonical en las etiquetas canonical de las páginas afectadas por enlaces directos a la canonical. Por servirnos de un ejemplo, si la página A es canonicalizada a la página B, que por su parte es canonicalizada a la página C, reemplaza el link canonical de la página A por un link a la página C.
Esta advertencia se dispara cuando hay un desajuste entre la canonical detallada y la URL de Open Graph en una o bien más páginas.
Si la URL del Open Graph no coincide con la URL canonical, entonces se compartirá una versión no canonical de una página en redes sociales.
Reemplaza la URL de Open Graph en las páginas perjudicadas por la URL canonical. Asegúrate de que las dos URLs sean las mismas.
Las URLs en las etiquetas de Open Graph han de ser absolutas y usar los protocolos http:// o bien https://, como es el caso de las canonicals.
Esta advertencia se activa en el momento en que una o más páginas seguras (HTTPS) especifican una versión no segura (HTTP) como la canonical.
, con lo que tiene sentido concretar versiones seguras de las páginas como canonicals cuando sea posible.
Redirigir la página HTTP al equivalente HTTPS. Si no es posible, añade un enlace rel=“canonical” de la versión HTTP de la página a la HTTPS.
Esta advertencia se activa cuando una o bien más páginas no seguras (HTTP) especifican una versión segura (HTTPS) como la canonical.
Se prefiere HTTPS a HTTP. Tener una versión HTTP de una página y después especificar la versión HTTPS como canonical es ilógico.
Es probable que esto no cause un enorme problema, mas merece la pena arreglarlo de ser posible.
Implementar una redirección trescientos uno de HTTP a HTTPS. También deberías reemplazar cualquier link interno a la versión HTTP de la página con links de forma directa a la versión HTTPS.
Esta advertencia se activa cuando una o más páginas no-canonicals aparecen en los resultados de búsqueda y consiguen tráfico de búsqueda orgánico (lo cual no debería suceder).
O bien las etiquetas canonical están configuradas de forma incorrecta o bien Google ha optado por ignorar la canonical detallada.
Comprueba que las etiquetas rel=canonical estén configuradas apropiadamente en todas y cada una de las páginas reportadas. Si no es así, emplea la herramienta de inspección de URL de Google Search Console para revisar si consideran que la URL canonical detallada es canonical realmente. Si hay una incompatibilidad, investiga por qué es así.
Las etiquetas canonical no son
tancomplicadas. Es difícil en un principio hasta que le hallas la vuelta.
Sólo recuerda que las etiquetas canonical no son una directiva sino una señal para los motores de búsqueda. En otras palabras, podrían seleccionar una canonical diferente a la que has declarado.
Puedes usar la en Google Search Console para ver tanto la canonical declarada por el usuario como la escogida por Google.
Estas son las clasificaciones que Google usa en su Informe del índice de cobertura de Google Search Console relacionadas con las URLs canonical:
¿Alguna pregunta? Déjala en los comentarios o bien escribeme.
Traducido por
. Desde Argentina, hacemos que te encuentren.