Cada vez que se aborda el tema del contenido en una página web o blog, las palabras calidad y original siempre salen a relucir. Captar la atención del público se torna complicado cuando el contenido no es ni de alta calidad ni original. Google analiza la cantidad de visitas para evaluar la calidad de un sitio: a mayor número de visitas, mayor es la calidad percibida, pues interesa a más personas. En cuanto a la originalidad, es vital que el texto sea único. Repetir el mismo contenido se considera contenido duplicado y puede ser perjudicial para el posicionamiento SEO de nuestro sitio web.
¿Qué es contenido duplicado en SEO?
El contenido duplicado se refiere a la presencia de textos idénticos o muy parecidos en diferentes dominios. Un gran número de sitios web ignoran las directrices de Google y replican contenido de otros portales, muchas veces debido a la ignorancia de que están mermando su SEO on page.
Existen otras páginas que lo hacen intencionalmente, ya que carecen de un equipo de redactores capaz de crear contenidos originales y de alta calidad. Tanto unas como otras, ya sea por malicia o desconocimiento, buscan manipular los rankings de motores de búsqueda como Google, Bing o Yandex, pero eventualmente serán sancionadas.
La penalización de Google Panda surge precisamente por esta práctica, debido al contenido duplicado dentro de una web. No obstante, no solo se penaliza cuando el mismo texto aparece en distintas URLs, sino también cuando varias páginas dentro de nuestro propio dominio contienen el mismo contenido.
Es relevante mencionar algo conocido como «common content», que no es tan dañino como el contenido duplicado, aunque aún impacta el posicionamiento del dominio. Un ejemplo común de esto se observa en los comercios electrónicos, donde es frecuente encontrar productos con características similares en varias páginas. Esto conlleva a una tienda online con contenido duplicado por no haber centralizado estos productos en una única URL.
Se considera contenido duplicado cuando dos o más páginas web, ya sean del mismo dominio o independientes, contienen textos idénticos o muy parecidos. ¿En qué consiste el problema? Que si Google detecta contenido duplicado en tu sitio, podría optar por no incluir estas páginas en los resultados de búsqueda, algo que claramente no nos conviene.
En resumen, el contenido duplicado perjudica el SEO, tanto a nivel interno como externo de nuestro dominio, ya que Google podría llegar a eliminar nuestra web por completo de los resultados de búsqueda.
¿Por qué el contenido duplicado afecta negativamente al SEO?
El contenido duplicado puede afectar negativamente nuestro posicionamiento, y existen varios niveles de penalización: desde una ligera pérdida de posiciones en los motores de búsqueda hasta la desaparición completa de los resultados de búsqueda. Esto último ocurre si Google detecta -o determina- que el contenido duplicado se ha creado de forma intencional para manipular el ranking en buscadores.
Además de estas repercusiones en buscadores, la persona autora del material, ya sea texto o fotografía, podría denunciar la copia, lo que conllevaría consecuencias legales. Sumado a esto, nuestra reputación online puede sufrir un grave deterioro si se descubre que estamos reproduciendo contenido ajeno. Cualquier comentario o queja publicada en una web o red social diferente a la nuestra dejará un rastro difícil de borrar, permaneciendo visible indefinidamente.
El contenido duplicado puede impactar negativamente el posicionamiento SEO por diversos motivos. Algunas de las razones son las siguientes:
- Los motores de búsqueda enfrentan problemas para decidir qué versión del contenido debe ser incluida o excluida en su clasificación. La presencia de contenido duplicado en diferentes páginas o dominios distintos puede perjudicar tanto la clasificación como el tráfico de los sitios web involucrados.
- Para asegurar una experiencia de búsqueda óptima para los usuarios, los motores de búsqueda evitan mostrar múltiples versiones del mismo contenido. Esto implica que el algoritmo de Google tendrá que determinar qué versión presentar al usuario.
Todo esto se traduce en:
- Una reducción en el tráfico orgánico, ya que Google no favorece la parición de páginas con contenidos duplicados en sus resultados.
- Menos páginas indexadas, lo que significa que si algunas de tus páginas no se están indexando, tus esfuerzos en SEO habrán sido en vano.
Tipos de contenidos duplicados en tú web
Muchos usuarios creen que el contenido duplicado solo ocurre cuando alguien toma fragmentos de tu sitio web o sus materiales. No obstante, y como ya hemos mencionado en la definición, no es la única situación posible.
Hay dos tipos de contenido duplicado:
Contenido duplicado interno. Ocurre cuando un mismo sitio web tiene contenido repetido en varias URL internas dentro de su propio dominio. Es una situación común en las tiendas en línea, que habitualmente contienen descripciones de productos estandarizadas, lo cual provoca similitudes en el contenido.
Contenido duplicado externo. Se refiere al contenido duplicado entre diferentes dominios. En otras palabras, cuando dos o más dominios distintos tienen la misma página indexada por los motores de búsqueda. Si todas las versiones se redirigen al dominio principal mediante un redireccionamiento 301, esta práctica no es perjudicial. No obstante, si esto no ocurre, el robot de Google puede confundirse y generar problemas de clasificación en los resultados de búsqueda.
Contenido duplicado interno
Sin darte cuenta, podrías estar afectando negativamente tu propio SEO al duplicar contenido. Aquí tienes algunos casos comunes:
- Fichas repetidas: Es probable que las descripciones de tus productos sean prácticamente iguales si solo cambian en talla o color.
- Catálogo similar al de otras tiendas: Si completas las fichas de tus productos con descripciones del proveedor o de otras tiendas al abrir tu e-commerce, estarás duplicando contenido.
Es posible evitar estos problemas utilizando las opciones de atributos proporcionadas por tu plataforma CMS y creando contenido valioso, original y útil. Observa el ejemplo de Lucía B, una marca española de complementos: sus fichas de productos son tan únicas (con un copywriting excepcional) que sirven como un poderoso elemento diferenciador de su imagen de marca. Ninguna otra tienda podría copiar esas descripciones sin que el plagio resultara obvio.
- Usar el mismo dominio con y sin el prefijo www. Esto ocasiona que existan dos sitios web idénticos con dominios diferentes.
- Emplear textos idénticos en varias páginas del mismo sitio web. Un ejemplo común de esto es en las descripciones de productos de tiendas online.
- Repetir las mismas etiquetas y metadescripciones en múltiples páginas del sitio web. Es recomendable redactar textos específicos para cada página en lugar de reutilizar los mismos.
- Tener la misma URL con distintas terminaciones dependiendo de su propósito. Un caso claro son los sitios web que tienen diferentes terminaciones según el país. Para Google, estas son páginas diferentes con contenido idéntico o muy similar.
- Realizar traducciones literales de contenidos que están en otro idioma. Google tiene la capacidad de detectar contenido duplicado incluso en lenguajes distintos.
Podemos decir, sin riesgo de equivocarnos, que el contenido duplicado interno es muy frecuente en las tiendas online, pero podemos decir que es poco frecuente que Google nos penalice por contenido duplicado interno.
Contenido duplicado externo
Es bastante común que otras páginas web repliquen tu contenido, lo cual es una situación desafortunada debido a la prevalencia del plagio en Internet. Esto sucede con frecuencia en sitios de afiliados y tiendas online de dropshipping (como Aliexpress, Amazon…), ya que los productos se agregan en bloque y los textos resultan ser idénticos en cada sitio de venta.
- Publicamos en nuestra web contenido extraído de otro sitio sin citar ni enlazar la fuente original.
- Modificamos palabras y frases del contenido de otros sitios para que parezca original en nuestro sitio, sin embargo, Google puede detectar este intento de manipulación.
- Otros sitios web replican nuestro contenido, en su totalidad o parcialmente, sin dar crédito a nuestra autoría o cambiando algunas palabras para engañar a Google.
- Al compartir nuestros contenidos con otras plataformas para aumentar visibilidad, estos pueden ser copiados de manera incorrecta, causando confusiones y problemas; un ejemplo es el envío de notas de prensa.
Herramientas para detectar contenido duplicado
Existen varias herramientas que pueden asistirte en la identificación de este problema en tu sitio web e incluso ofrecerte una solución eficaz. A continuación, te presento algunas de ellas:
GOOGLE SEARCH CONSOLE
Google Search Console, anteriormente conocido como Google Webmaster Tools, nos revela qué meta títulos y descripciones duplicadas existen en nuestra web. Esta información la encuentras en «Mejoras de HTML» dentro del apartado de Aspecto de la búsqueda. Además, la herramienta te indica qué contenido del sitio no es indexable por diversas razones como pueden ser archivos de vídeo o imágenes.
Es recomendable que revises esta sección de Search Console con regularidad para mantener tu página optimizada y aumentar tus oportunidades de mejorar el posicionamiento en los resultados de búsqueda de Google.
Aunque Google aclara que encontrar incidencias aquí no implica que vayan a dejar de indexar tu sitio, resolver estos problemas es crucial para atraer más tráfico hacia tu dominio.
Por otro lado, Google Search Console no se limita a detectar contenido duplicado; tiene muchas otras funcionalidades. También te permite consultar el origen del tráfico, el número de páginas indexadas y problemas de seguridad en la web, entre otros aspectos.
SITELINER
Siteliner es una herramienta efectiva para identificar contenido duplicado dentro de nuestro sitio web. Nos proporciona un porcentaje detallado del contenido duplicado y las URLs afectadas. Su funcionamiento es extremadamente sencillo. No es necesario registrarte para utilizar Siteliner; basta con ingresar la URL de tu sitio web o tienda online, y en cuestión de minutos tendrás un informe de los contenidos duplicados en el sitio.
Además de detectar contenidos duplicados, Siteliner puede ayudarte a identificar enlaces rotos, páginas no indexadas y la velocidad de carga de tu sitio.
Aunque estés seguro de no haber copiado textos de otras páginas, Siteliner podría mostrarte un cierto porcentaje de contenido duplicado. No te preocupes, esto generalmente está relacionado con las paginaciones o categorías del blog. Es común que este porcentaje no sea muy alto, ya que un porcentaje elevado podría indicar un problema de SEO.
La versión gratuita de Siteliner permite analizar hasta 250 páginas. Si necesitas analizar más de esta cantidad, tendrás que optar por la versión de pago, que permite analizar hasta 25.000 páginas y ofrece funcionalidades adicionales.
COPYSCAPE
Muchos consideran a Copyscape como la herramienta más efectiva, para mí lo es, para identificar contenido duplicado en la web. Solo es necesario ingresar la URL de la página sospechosa, y Copyscape te informará si el contenido se ha copiado correctamente o si es preciso sugerir modificaciones o suprimir el material afectado.
Igualmente, puedes utilizar Copyscape para verificar qué páginas de tu dominio han sido plagiadas y en qué sitios web. La versión gratuita permite realizar hasta diez búsquedas diarias, mientras que la versión premium, que implica un costo inferior a un euro por cada búsqueda, ofrece más flexibilidad.
Una función destacada de la versión premium es la capacidad de verificar si un artículo que planeamos publicar será reconocido como duplicado antes de subirlo. Simplemente copiamos el texto en una caja de texto y Copyscape nos indicará si el contenido podría perjudicar, en lugar de beneficiar, nuestra estrategia SEO.
SCREAMING FROG
Es una herramienta para tu PC muy completa y sencilla de utilizar, disponible para Windows, Mac y Linux. Screaming Frog proporciona una interfaz intuitiva que facilita la detección y análisis de contenido duplicado, así como otros errores como enlaces rotos. Con esta herramienta, puedes identificar rápidamente etiquetas h1, h2 o h3 duplicadas y determinar qué páginas tienen el mismo title o meta description.
Además, permite generar el archivo Sitemap XML de manera rápida, el cual puedes enviar a Google mediante Search Console. Aunque, si tu sitio web está hecho con WordPress, es más aconsejable generar este sitemap usando el plugin SEO by Yoast.
Independientemente del sistema operativo que utilices, ya sea Windows, Mac o Linux, podrás instalar esta aplicación en tu ordenador. La versión gratuita permite rastrear hasta 500 páginas, mientras que la versión de pago, recomendada para sitios de mayor envergadura, cuesta 149 libras anuales y ofrece un conjunto adicional de funcionalidades.
PLAGIUM
Con Plagium solo necesitas insertar un fragmento de texto de tu web (hasta un máximo de 5.000 caracteres) para verificar si hay contenido duplicado. La herramienta te indicará qué otras páginas, si es que existen, han utilizado el mismo contenido.
Es gratuita y no requiere registro si solo deseas revisar un texto. Sin embargo, si buscas analizar una URL o evaluar un archivo de texto en formato Word o PDF, necesitarás registrarte e iniciar sesión. Además, Plagium ofrece servicios profesionales en su sitio web para quienes buscan un análisis exhaustivo de posibles plagios en sus páginas.
PLAGIARISMA
Plagiarisma, al igual que Plagium, no solo nos permite detectar contenido duplicado a partir de un archivo (txt, doc, html, xls, pdf, epub, etc.), sino también desde un fragmento de texto o una URL. Puedes utilizar la herramienta cuantas veces desees si te registras, pero si no lo haces, está limitada a una vez al día.
Consulta textos en más de 190 idiomas rastreando tanto en Google, Bing como en Yahoo!. Además de buscar textos que puedan haber sido plagiados en otras webs, también se emplea para encontrar artículos, patentes, opiniones legales y revistas en Google Scholar.
El registro en Plagiarisma es completamente gratuito y puede realizarse a través de tu cuenta de Facebook, Twitter, Google Plus o LinkedIn.
SEMRUSH
SEMRush es una potente herramienta que no solo realiza una auditoría SEO completa de nuestro sitio web, sino que también tiene la capacidad de identificar contenido duplicado. Su característica más destacada es la capacidad de revelar quiénes son nuestros mayores competidores tanto en SEO como en SEM. Además, esta aplicación es muy útil para determinar qué palabras clave debemos utilizar basándonos en los resultados obtenidos por nuestra competencia en sus estrategias de SEO.
Aprende a corregir el contenido duplicado
Sabiendo ya qué es el contenido duplicado, cómo identificarlo y los daños que puede causar a tu tienda en línea, es momento de ponerse manos a la obra y solucionarlo.
1. Redacta descripciones de producto originales
Es fundamental no replicar las fichas de tus proveedores o competidores, y poner un gran empeño en crear descripciones únicas que contengan tus palabras clave.
2. Establece la URL canónica
Si cuentas con múltiples páginas que poseen contenido similar o igual y deseas que Google enfoque su atención solo en una de ellas, debes implementar la canonización de URLs. ¿Has oído hablar de este concepto?
Una URL canónica es una etiqueta dentro del enlace HTML que indica al contenido web que se pretende destacar en la SERP.
Al emplear URLs canónicas:
- Google no detecta el contenido de las páginas como duplicado, ya que le indicas cuál es la principal.
- Evitas la canibalización de tus keywords.
- Disminuyes las penalizaciones dado que el buscador no pierde tiempo decidiendo cuál página es la más relevante.
- Facilitas una mejor organización de los contenidos y artículos que deseas exhibir en los resultados de búsqueda.
Para señalarle a Google cuál es tu URL canónica…
Añade una etiqueta en el encabezado HTML de cada subpágina de tu dominio.
De esta manera, logras que solo la URL canónica sea indexada, previniendo así problemas de contenido duplicado y evitando penalizaciones de Google. ¿Qué página deberías designar como canónica? Obviamente, la que mejor índice de conversión posea.
3. Crea meta-title y meta-descripciones diferentes para cada producto
Es crucial personalizar de manera adecuada tanto las etiquetas del título como las de meta para cada ficha de producto en tu e-commerce. El título de tu página, conocido como «title», es el nombre que aparece en azul como enlace cuando alguien busca en Google. Por otro lado, la descripción es la breve “explicación” que se muestra justo debajo del título en los resultados de búsqueda y también debe ser única para cada artículo.
Un buen ejemplo de esta práctica es la forma en la que Mr. Wonderful maneja las metas de sus productos. Optimizar los titles y las descripciones no solo evita que se duplique el contenido, sino que también mejora tu visibilidad en las páginas de los motores de búsqueda, beneficiando directamente tu estrategia SEO.
4. Configura correctamente las redirecciones 301
A veces, pueden suceder equivocaciones que resulten en contenido duplicado debido a errores simples, como publicar accidentalmente el mismo post dos veces. En tales situaciones, solo es necesario tener una única URL activa; por lo tanto, lo más recomendable es redirigir la URL «duplicada» a la original.
¿En qué consiste redireccionar?
Significa llevar al usuario a una URL diferente cuando hace clic en un enlace. Para Google, redireccionar es comparable a combinar dos contenidos en uno solo.
5. No copies contenidos de la competencia
Aunque parezca obvio, es importante recordarlo: evitar la duplicación de contenido intencionalmente es esencial.
Referencias sobre el contenido duplicado
Desmitificar el Duplicate Content-Penalty
Contenido Duplicado – Ayudas de Google para los Websmaster
- Palabras Clave de Oportunidad: ¿Qué son, cómo y dónde localizarlas? - 26 julio, 2024
- Páginas Amarillas: Cómo Extraer Contactos - 22 julio, 2024
- Cómo Extraer Datos de Google Maps Gratis - 18 julio, 2024