Le référencement Web est un domaine qui recèle encore de nombreux «mystères» pour les utilisateurs d’internet, y compris les experts de l’optimisation Web et les rédacteurs pour le Web.
Voici une mise au point sur le contenu dupliqué 5 ans après la mise en place du filtre Panda, il va vous étonner, car cela bouscule pas mal les idées reçues.
Dupliquer du contenu ne pénalise pas (forcément) votre positionnement SEO
Si je vous dis que publier un texte dupliqué d’un autre site Web n’a pas d’influence sur le positionnement de votre site dans les moteurs de recherche, vous le croyez ?
Non bien sûr.
C’est vrai, depuis 2012, avec la mise en place du filtre Panda puis son intégration dans l’algorithme de Google, pourtant cette règle doit être pondérée.
Pour commencer, nous allons citer Google Search Quality Evaluator Directives de Mars 2017
Google est intraitable si tout le contenu principal est copié, même si la page source est citée.
Mais le moteur de recherche fait une différence entre le contenu brutalement copié/collé et la duplication avec valeur ajoutée.
Regardez et écoutez Andrey Lipattsev en parler au cours d’un webinar.
Bien entendu, dans une perspective SEO, il vaut mieux éviter de dupliquer du contenu existant sur une autre URL. Google recherche les textes neufs et les doublons le ralentissent en déclassant votre site.
Si vous êtes tout de même tentés de reprendre un article pour le republier sans vous faire blacklister, il existe des solutions…
La balise canonique
Google n’applique pas forcément une pénalité si vous dupliquez un même texte depuis les pages de votre propre site, c’est d’ailleurs le point faible des CMS : WordPress, Joomla, et autres, trop souvent non ou mal configurés pour le référencement Web.
Des règles doivent être appliquées pour éviter la pénalité : le « secret » s’appelle « les balises canoniques ». La balise link rel=canonical est une balise HTML qui permet d’indiquer aux moteurs de recherche l’URL de référence d’une page donnée, qui se décline dans plusieurs répertoires, typiquement
- X catégories
- X tag
- auteur
- dates
- projet
- portfolio
- etc
C’est un moyen simple de mentionner au moteur de recherche qu’il existe une version originale et officielle d’un texte et que seule cette URL officielle doit être prise en compte et non le plagiat
Le plus simple est de placer cette balise dans l’en-tête HTML de la page originale en respectant la taxinomie suivante : <link rel=» canonical » href=» URL »/>
L’utilisation de l’élément « link rel=canonical » poursuit 4 objectifs principaux pour l’optimisation du SEO.
La balise canonique permet :
- D’aider les moteurs de recherche à identifier facilement et rapidement quelle page inclure ou exclure de leur indexation ;
- De savoir quelle version de l’URL doit remonter dans les requêtes de recherche ;
- D’éviter les pénalités (Panda) liées à des contenus dupliqués très souvent générés automatiquement par les CMS mal utilisés ;
- D’augmenter la popularité d’un contenu en mutualisant sur une URL unique les liens entrants. Il se peut que plusieurs liens entrants pointent vers un même contenu, mais que ces liens permettant d’accéder au contenu varient en fonction des paramètres de tri qu’ils contiennent.
Le protocole sitemaps XML
Si vous souhaitez que Google découvre et explore rapidement votre contenu, il est conseillé de mettre en place un protocole sitemaps XML (informer les moteurs de recherche que les adresses d’un site web sont disponibles pour l’indexation automatique). Vérifiez que votre site est doté du fichier/sitemap.xml (par default) et soumettez-le dans votre Google Console.
Réagir en cas de vol de contenu
Si vous constatez qu’un site web a dupliqué votre contenu, et que vous n’êtes pas d’accord, vous pouvez remplir une demande pour supprimer ce contenu en vertu du Digital Millennium Copyright Act.
Vous pouvez aussi lui demander de la retirer ou lui demander de citer l’article original au moyen d’un lien. Souvenez vous que c’est le blogue voleur qui est pénalisé et non le blogue victime.
Copier et enrichir des pages Web
Il reste possible de reprendre certains contenus de valeur pour autant que vous les enrichissiez de votre propre prose.
Il semble que si le plagiat ne dépasse par 30 % de l’ensemble du texte édité, vous passiez sous le radar de la pénalité. Cela signifie que si vous reprenez un 300 mots il vous faudra écrire 700 mots entrelacés dans les paragraphes existants pour éditer votre 1000 mots.
Je ne conseille pas vraiment cette pratique et je n’en parle jamais au cours de mes formations en rédaction Web, parce que les abus deviennent vite pratique courante et que ce type de copier-coller doit rester être rare et utilisé avec prudence… et finalement fait-elle vraiment gagner du temps ?
Quoi qu’il en soit, mentionnez l’auteur de la partie recopiée au titre de la citation ou d’inspiration et faites-lui un lien, cela ne coûte pas cher et vous vous ferez des amis.