Contenido duplicado en SEO: Qué es y cómo detectarlo

Según Gary Illyes, el 60% de la web sería contenido duplicado, lo que significa que de todas las URLs disponibles en internet, 3/5 del contenido sería copiado. Es una estadística realmente sorprendente, ¿no crees? Aunque no necesariamente significa que este contenido se haya duplicado intencionalmente.
¿Qué es el contenido duplicado?
El contenido duplicado es la reproducción parcial o total del contenido existente dentro de un sitio o de una web externa. Así pues, hay 2 tipos de contenido duplicado que son tratados de manera totalmente diferente.
En primer lugar, el contenido duplicado interno, y por lo tanto la duplicidad de contenido entre diferentes páginas de un sitio bajo el mismo dominio. Luego tenemos el contenido duplicado externo. Alguien reproduce exacta o parcialmente el contenido de tu sitio o viceversa. Por lo tanto, el contenido estará presente en otro dominio.
¿Perjudica a mi sitio web?
El contenido duplicado (externo o interno) ofrece un extra de trabajo a Google, ya que su robot tendrá que rastrear, indexar y clasificar el contenido de todas las páginas duplicadas dos o más veces. Técnicamente se dice que estás desaprovechando el Crawl Budget (presupuesto de rastreo) que Google tiene asignado a tu web. Más específicamente en el comercio electrónico, existe un error muy común, y es que los webmasters del sitio copian literalmente el texto de las fichas de producto de sus proveedores.
El contenido duplicado no aporta valor añadido a tu sitio, pero tampoco lo penaliza, a menos que Google advierta que lo estás haciendo de una manera engañosa. Google elegirá la versión original en función de la fecha de la primera indexación y de la popularidad del sitio. Por lo tanto, la versión duplicada no ganará autoridad por el contenido copiado.
¿Cómo puedo encontrar contenido duplicado?
Hay ciertamente varias maneras de detectar el contenido duplicado, pero en términos de contenido duplicado externo, os aconsejamos uséis Plagiarism Checker. Un sitio gratuito realmente útil para detectar si el contenido está duplicado externo de tu web y determinar el porcentaje de duplicación. Por supuesto, si estás buscando un programa más completo y pagado para analizar todo el contenido interno y externo duplicado de tu sitio, hay algunos que satisfarán tus necesidades. Por ejemplo, Safecont, el cual te agrupará tus URLs por riesgo de penalización por Panda (Panda Risk), pudiendo dar prioridad a un grupo u otro en función de la puntuación.
Como conclusión, se podría decir que invertir recursos en contenido original es una gran opción, por no decir obligatorio, ya no sólo de cara a Google, sino también del usuario. A fin de cuentas, es quien nos va a comprar en nuestro ecommerce, o contratar nuestros servicios.