El contenido duplicado en SEO

¿Cómo afecta el plagio al posicionamiento orgánico?

Se suele decir que un contenido duplicado en una web es una de las problemáticas más comunes y que a su vez puede afectar más al posicionamiento de una url.

Esta última afirmación no es del todo cierta, puesto que Google no penaliza de forma directa a una página web por contener artículos duplicados, aunque no quita que pueda perjudicar al mismo mediante otros métodos.

Cuando Google detecta un contenido duplicado o plagiado, lo único que hace es organizar los resultados de búsqueda según su criterio acerca del que puede ser más interesante para el usuario. El resto de enlaces que poseen el mismo contenido puede hacerlos desaparecer de los primeros resultados de búsqueda  para no ofrecer al consumidor una y otra vez el mismo contenido en todas las búsquedas que realice.

Pero… ¿qué considera Google contenido duplicado?

Se puede decir que una web posee archivos duplicados cuando cualquiera de sus contenidos (ya sea una imagen, un texto, un vídeo,…) se pueden encontrar en otra URL, con una coincidencia total (siempre y cuando no sea un archivo de gran poder divulgativo como un vídeo de Youtube o cualquier otra plataforma).

El encargado de detectar todo esto y organizarlo según los criterios de Google es el algoritmo Panda, del que ya hablamos con anterioridad en este blog.

¿Cuáles son las causas de este plagio?

Puede parecer sencilla la respuesta contestando simplemente que se produce si alguien copia y pega un artículo visto en otra URL y lo publica en su blog o página web. Sí, esta puede ser una forma de plagio pero no es la más frecuente. La mayoría de contenidos duplicados detectados por Google proceden de problemas internos en nuestras propias páginas web.

¿Cuáles son estas causas internas y cómo resolverlas?

  • Creación de una versión para dispositivos móviles: Habitualmente las versiones para dispositivos móviles generan su propia URL diferente a nuestra web principal vista desde un ordenador de sobremesa. Si no somos capaces de dar a entender a Google que es la misma web, habilitando que nuestro sitio web es responsive y por consiguiente que se trata de sólo una expansión de la misma y no una nueva, el algoritmo del buscador puede pensar que es un contenido plagiado de otra web totalmente diferente.
  • Generación de URLs en contenidos: En ocasiones poseemos sitios web que asignan una URL aleatoria para mostrar los diferentes contenidos de nuestra web cada vez que la previsualizamos. Al ser una URL distinta cada vez, ya que se genera automáticamente, pueda ser motivo de equivocación para el algoritmo de Google que puede interpretarlo de nuevo como que se trata de contenido plagiado.
  • No haber establecido un dominio principal: Si no se ha indicado un dominio principal a tu web, ésta se podría visitar tanto con “www” como sin ellas, lo que puede dar lugar a cierta confusión y que Google establezca que se trata de dos dominios distintos. Esto se denomina como “URL no canónica”.

La solución es sencilla. Estableciendo en Search Console un dominio principal o preferido, sería suficiente.

  • Conexión segura: si tu web posee una encriptación SSL y no ha sido configurada correctamente, podría ser accesible desde http:// como https:// y considerarse así dos URLs totalmente independientes. Conviene realizar una correcta implantación del certificado de seguridad para poder evitar este problema.
  • Numeración de páginas o resultados de búsqueda: Cualquier sitio web que utilice una numeración para cualquier producto o resultados de búsqueda es sensible de poder ser catalogado como contenido plagiado. Para evitarlo, se recomienda siempre emplear títulos y descripciones personalizadas para cada una de las páginas o productos. Con esta acción, aparte de evitar lo citado anteriormente, también influiremos positivamente en la mejora del posicionamiento orgánico.
Valóranos

2 comentarios. Dejar nuevo

  • Muy interesante vuestra aportación sobre el contenido duplicado, y sobre el mismo, tengo una duda que quizá me pudieran ayudar a resolver
    He desarrollado una web responsive con la ayuda de unas plantillas “Ulkit”.
    Para cada línea, defino el ancho de pantalla y el contenido visible para esa resolución, por lo que si visualizamos el código de página, y por poner un ejemplo, veremos que aparecen 2 H1 iguales, uno visible en resoluciones de <768 pixeles y otro visible para resoluciones mayores.
    Si analizo mi web con las herramientas SEO, me dicen que tengo 2 H1. Mi pregunta es ¿Los motores de Google también lo interpretan así, y lo consideran como contenido duplicado?
    He de decir que mi desarrollo es totalmente autodidacta, por lo que posiblemente no se ajuste a los cánones más correctos.
    Gracias y un saludo

    Responder
    • La Biznaga Digital
      27 agosto, 2018 13:23

      Hola Miguel:

      Creemos que debe tratarse de un error relacionado con la visualización de la página. El tema del ancho de pantalla y los contenidos que se ocultan corresponden más bien al CSS de la página.
      Las h1, sin embargo, forman parte del html. Es decir, en una web responsiva lo que cambia según el dispositivo es el CSS, mientras que la estructura básica del html se mantiene.
      En todo caso, mirando el código de la página en cuestión sólo se observa una h1.

      El caso de una h1 duplicada podría haberse dado si la página, en vez de ser responsiva, tuviera una versión distinta (y por tanto, una url diferente) para móvil y escritorio, como por ejemplo:

      https://www.myphotobook.co.uk/ (versión escritorio)

      https://m.myphotobook.co.uk/ (versión móvil)

      Responder

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Rellena este campo
Rellena este campo
Por favor, introduce una dirección de correo electrónico válida.

Menú