Contenido duplicado en WordPress
|WordPress es la plataforma de weblogs que usamos la mayoría de los bloggers. Las características del WordPress hacen que sea el sistema de gestión de contenidos desarrollo en PHP y MySQL más flexible, está optimizado para los buscadores, es rápido y eficaz, fácil instalación y actualización, personalización hiper > mega > súper > exquisita 🙄 que lo hace el mejor sistema automatizado.
Pero, inocentemente, esa misma flexibilidad nos podría traer desfavorecimientos gracias al contenido duplicado que genera sin querer queriéndo. 😆
Las primeras evidencias del contenido duplicado producido por tu CMS de WordPress se pueden encontrar en tu sidebar. Las categorías y los archivos basados en fechas son los pioneros de ésto.
Las páginas de la categoría almacenan tus artículos fijados bajo mismo asunto – una categoría. Tales páginas no tienen ningún contenido único; son una colección de tus artículos anteriores. La publicación mensual y los archivos diarios también agrupan simplemente tus artículos anteriores rigiéndose en la fecha.
El contenido duplicado generado en WordPress es sin duda alguna, las categorías, archivos basados en fechas y también los feeds, pues allí está el mismo contexto (con otra estructura) de las entradas o artículos publicados.
Muchos webmasters SEO’s profesionales recomiendan varias técnicas para poder evitar el contenido duplicado en WordPress, las cuales ampliaré detalladamente en éste artículo tocando puntos específicos como los beneficios obtenidos…
El problema se basa en que: si tienes un enlace permanente a un artículo, tienes el mismo artículo en la categoría y adicionalmente a eso, tienes los feeds… ¿Cuál de los tres debería posicionarse? Es allí donde radica la problemática del contenido duplicado en WordPress.
El contenido duplicado es una técnica o práctica que está claramente penalizada por los buscadores, lo cual a muchos, nos tiene algo nerviosos. 🙄
Parto de la idea de bloquear algunas cosillas en el archivo robots.txt. Mi caso personal es algo habitual en muchos bloggers, pueden ver mi archivo robots.txt, lo tengo de la siguiente manera:
User-agent: *
Disallow: /wp-
Disallow: /search
Disallow: /?s=
Disallow: /feed
Disallow: /comments/feed
Allow: /feed/$
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$
Allí le estoy diciendo a las arañas de los buscadores que por favor, no indexen algunos directorios de mi sitio web.
Recomiendo a todos los bloggers que utilicen la etiqueta < ! — more –> en la página principal de su blog, pues así realizarían un extracto del artículo y al darle «leer más», podrán acceder al artículo completo. Yo lo utilizo, como pueden ver… 8)
Leyendo en un artículo de seorechearser.com titulado How to Make a WordPress Blog Duplicate Content Safe, encuentro más prevenciones para evitar el contenido duplicado en WordPress.
Resaltan la necesidad de incluir las etiquetas no-index / no-follox en las meta-tags para que no sean idénticas ya que ésto derivaría contenido duplicado…
Existe un plugin llamado WordPress Duplicate Content Cure que nos automatiza todo éste trabajo de las meta-tags y blah blah blah, recomiendo descargarlo e instalarlo ahora mismo.
En resumidas cuentas:
> Actualiza tu robots.txt, recuerda que allí expones las limitaciones que le estipularás a los buscadores respecto a tu sitio web.
> Instala el plugin antes mencionado que también ayudará mucho.
Chamo esta muy bueno tu blog, realmente sitetisas mucho la info de los demas blog. Algo muy bueno que tienen tus post es el mini resumen que haces al final! continua así. saludos
Gracias por tu comentario ccshack…
¡Qué honor contar con tu visita! 8)
Muy buen blog compañero ahora te agrego a mi lista de feeds y a mi blogroll
Hola, Kervin
Llegué a tu Blog buscando algo sobre como bloquear las categorias a los buscadores para evitar el contenido duplicado, y tu artículo estaba entre los primeros de los resultados.
Pues bien, quiero bloquear las categorías mediante el uso de robots.txt, sin necesidad de utilizar el plugin, puesto que este me esta funcionando mal, ya qe me muesta las dos eiquetas, tanto la que pide indexar como la que no.
Aquizás tengas algo por ahí.
Saludos!
Sabogal, qué agrado verte por acá.
El uso del fichero robots.txt es bastante ideal para bloquear cualquier directorio para que así los buscadores no lo indexen.
Lo único que debes hacer para que Google o cualquier otro buscador no indexe cualquier directorio específico (en tu caso supongo es category) es agregar «Disallow: /directorio».
¿Más sencillo? Imposible. Cualquier otra consulta ya sabes que por aquí o IM me puedes encontrar fácilmente. Un placer 😉