El contenido duplicado y como afecta al SEO de nuestra web

Herramientas para gestionar el contenido duplicado SEO

09/02/2023

Si estás en esta web es porque conoces la importancia de tener contenido original y de calidad. Google penaliza a los sitios que utilizan contenido duplicado bajándolos de las primeras posiciones.

Pero lo cierto es que existen diferentes tipos de contenidos duplicados y, por lo tanto, distintas soluciones. En este post te voy a contar como puedes solucionar algunas, incluso de SEO técnico, sin usar lenguajes de programación.

¿Qué es el contenido duplicado y como se puede solucionar?

Con un 85% de coincidencia, se considera contenido duplicado. Pero tampoco hay que obsesionarse y quitar todo lo que se repita. Siempre hay que actuar con sentido común. Por ejemplo, Google entiende que tanto el pie de página como el menú se van a repetir en todas las páginas.

Un caso muy común de contenido duplicado lo podemos encontrar en los e-commerce con productos muy similares. Por ello, es recomendable que se cree una sola ficha de producto y en uno o varios desplegables, poner las variaciones de producto. Por ejemplo, talle, color; o si es un servicio: presencial, online, streaming, primera parte, segunda parte… ¡Lo que sea! Antes de publicar páginas a diestro y siniestro, hay que tener clara cuál va a ser la arquitectura web. O si no, pagarle muy bien al SEO-Copywriter porque menudo trabajazo se va a pegar… 😉

También puede ocurrir que nuestra web de comercio electrónico tenga el mismo proveedor que la competencia. Un error muy grave de SEO content, es copiar la ficha del fabricante. Probablemente otras webs hagan lo mismo, pero además no estamos añadiendo valor, ni hay un tono de marca específico para llegar a nuestro buyer persona.

De estos 2 ejemplos podemos ver que, aún tratando ambos de fichas de producto, el tipo de contenido duplicado es diferente. El último caso, se trata de contenido duplicado externo. Por este sí que nos penalizará Google. El primer caso, el interno, no suele estar penalizado, pero es mejor no tenerlo. ¿Quieres saber cómo evitarlo?

De esto vamos a hablar en el siguiente apartado.

Duplicidad interna

Para solucionar un problema de contenido duplicado externo se debe contactar (de forma educada y amable) con el sitio que aparentemente nos copió el contenido. Cuando es interno, la solución pasa por nosotros mismos.

Pero, ¿cómo resolver cuestiones de SEO técnicas si me dedico al SEO de contenidos? Muchas cosas se pueden hacer con plugins. Para las que no y que excedan las competencias del SEO-Copywriter, podemos contar con un informático que conozca de SEO técnico y lenguajes de programación. Son dos carreras diferentes. O ¿tú le pedirías a un psicólogo que saque una muela del juicio? Pues no sé por qué no, si son los 2 del sector sanitario… 😅 

Herramientas para evitar el contenido duplicado

Lo primero será verificar que las versiones de la url que apuntan a la home de tu web sean la misma. Con y sin 3 w y https en vez de http. Para el primer caso puedes hacer una redirección 301 con el plugin Redirections. En el segundo caso, puedes usar el plugin Really Simple SSL. Un informático probablemente lo haga del .htacces, pero si no lo eres y no es tu web personal, te recomiendo que no lo hagas.

Hay un punto intermedio, para que no tengas que descargar tantos plugins. Como el de Yoast SEO lo tienes que tener sí o sí, porque además es mi favorito, puedes hacer redirecciones desde herramientas – .htacces. La forma de hacerlo es igual que en el panel de tu hosting, pero al hacerlo en un plugin, quizás te resulte más fácil. Debes ponerlo así, reemplazando las urls. La primera no lleva el dominio y la segunda sí:

redirect 301 /wp-content/uploads/2022/01/OGILVY-PUBLICIDAD-copywriting.jpg https://belenmarti.com/wp-content/uploads/2022/01/ogilvy-copywriting.jpg

Como puedes ver, a veces las imágenes y no solo las páginas, nos pueden dar error 404.

Volviendo al tema del post. Una razón por la que las webs tienen mucho contenido duplicado interno es por los idiomas y, en consecuencia, un mal uso de la etiqueta hrflang. Por ejemplo, crear un sitio en español, inglés y catalán, pero no subir las correspondientes traducciones. Para este tema recomiendo el plugin Polylang y te olvidarás del mencionado código.

Home en español e inglés y Cookies no indexadas. Evitar contenido duplicado con Screaming Frog

Otra cosa que genera contenido duplicado sin darnos cuenta son las categorías y las etiquetas de los blogs. Todo lo que filtre. Estas van a listar el mismo contenido en diferentes páginas según nuestra intención de búsqueda. Así que, salvo que lo tengas todo muy estructurado, mi consejo que añadas la etiqueta noindex a las categorías. Esto lo puedes hacer sin mayor dificultad con Yoast SEO, apartado de taxonomías. También te recomiendo que quites los archivos de autor.

En otra cuestión que nos puede ayudar este potente plugin es con las canónicals. Para el caso que habíamos mencionado de un e-commerce que no ha estructurado bien sus fichas de producto, generando contenido duplicado, podemos utilizar este método. Lo que hacemos es decirle a Google cuál de esas páginas (camiseta verde, azul y roja) es la que queremos posicionar. Esto se hace desde el apartado avanzado del plugin.

Por último, no te olvides de poner noindex a todas las páginas de Cookies y Políticas de privacidad. En Yoast SEO: “no permitir a los motores de búsqueda mostrar esta página en los resultados”.

¿ChatGPT genera duplicidad de contenido o plagio?

Esta es la pregunta del millón. No vamos a entrar a analizar en qué nos puede ayudar ChatGPT a los creadores de contenido, porque ello daría para otro post. Pero, en cuanto al contenido duplicado, le he preguntado directamente al chat de OpenAI y ha dicho:

» ChatGPT es un modelo de lenguaje generativo desarrollado por OpenAI, y su uso está sujeto a los términos de servicio de OpenAI. Según los términos de servicio de OpenAI, no está permitido utilizar el contenido generado por ChatGPT para fines comerciales sin el permiso previo de OpenAI. Además, se requiere que se proporcione crédito a OpenAI cuando se utilice contenido generado por ChatGPT. En cuanto a contenido duplicado, el contenido generado por ChatGPT no es único, ya que se basa en un gran corpus de datos de texto existente. Por lo tanto, es probable que el contenido generado por ChatGPT ya exista en algún lugar en Internet. Sin embargo, si su blog es un blog personal y solo lo estas utilizando para fines personales, no debería haber problema.»

Con lo cual, no solo tendríamos que citar a la fuente, ChatGPT, porque de lo contrario tendríamos problemas de copyright; sino que además tendríamos contenido duplicado, ya que no son textos únicos.

¿Cómo saber si tengo contenido duplicado en mi web?

La mejor forma de saber si tienes contenido duplicado en tu web es utilizando Semrush. Haz clic en auditoria de sitio, en la web que quieras analizar, y pasados unos segundos obtendrás toda la información. Esta herramienta te indicará: las páginas que tienen problemas de contenido duplicado, las metadescriptions duplicadas, los H1 duplicados, entre otros errores de la web como los enlaces rotos, etc.

Cada uno de estos fallos tiene un procedimiento distinto. Lo ideal es que te descargues el listado en un Excel, así te puedes organizar de forma más óptima.

Ten en cuenta que tener meta descripciones duplicadas es peor que no tenerlas. Aunque el método correcto es comenzar con el SEO y las keywords desde que se construye la web, podemos reescribirlas al igual que los h1.

Y tú, ¿Cómo gestionas el contenido duplicado de tu sitio? ¡Te leo en comentarios!

Quizás también te interese…

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

16 + 4 =