Aider les moteurs de recherche à répondre à la question de base « de quoi parle ce texte » – tel est notre rôle en tant que rédacteur web SEO au moment où l’on pense à produire le contenu d’un site Internet.
Parce que les moteurs de recherche ne lisent pas les textes de la même façon que l’être humain, nous devons respecter une structure et poser des indices qui se rapportent au sens du contenu.
C’est sur le critère de pertinence et en appliquant les techniques qui favorisent la compréhension sémantique d’un texte par les moteurs de recherche que l’on donne une chance à ce texte d’atteindre les meilleures positions dans les résultats de recherche sur le web.
Le présent article examine un ensemble de techniques on-page qui se renforcent entre elles si elles sont combinées de façon adéquate.
Google ne révélant pas les détails de son algorithme, MOZ, le site qui fait autorité en termes d’analyse du SEO a recueilli et colligé sur plusieurs années
- les résultats d’entrevues,
- de travaux de recherche,
- de dépôts de brevets américains et
- d’observations de centaines de spécialistes du marketing en ligne,
afin d’explorer ces procédés. Cet article original doit beaucoup à Bill Slawski, dont les articles sur SEO by the Sea ont étayé ce travail de recherche.
En lisant ce papier, gardez à l’esprit que :
- ce ne sont que quelques paramètres utilisés par Google qui peuvent déterminer la pertinence des articles en ligne, et que
- ce ne sont pas des règles absolues !
- un codage adéquat de votre site est requis
- l’architecture de votre site joue un rôle essentiel (l’architecture n’est ni la navigation, ni l’ergonomie su site…)
- et que le netlinking a encore de beaux jours devant lui.
Ma propre expérience de rédacteur de contenu Web me permet d’affirmer que le présent article est l’un de ceux qui vont le plus loin dans le détail de ce qu’est la rédaction orientée pour moteur de recherche.
Nous allons commencer par des principes simples, et passer ensuite à un niveau plus avancé. Accrochez-vous
Utilisation de mots et d’expressions clés
Avant Panda (2011), on a vécu les mots clés mitraillettes. Des mots clés plein la page… Certains textes en affichaient des densités supérieures à 10 %, illisibles… à en tomber par terre.
Le concept était le suivant : si votre page traitait principalement d’un sujet particulier, les moteurs de recherche repéraient des mots clés dans certaines sections importantes, comme la triplette dite du bourrin (chère à L. Bourrelly) :
- balise titre,
- H1,
- URL
sans compter la alt des images, et le parsemage du mot un peu partout dans le texte.
La personne qui faisait ce triste travail avait soin d’effectuer une recherche du mot clé et le dispersait dans la page ; cela constituait la base d’une page optimisée pour un mot clé. Et cela marchait… Ceci dit, les études et les résultats ont démontré que l’impact de ce procédé n’est plus ce qu’il était.
SEO à ce jour
Aujourd’hui, bien qu’il soit important que votre page contienne minimalement les déclinaisons des mots clés sur lesquelles vous souhaitez qu’elle remonte, il est peu probable que leur seule présence assure les chances de visibilité de votre page.
Aujourd’hui, on détermine toujours des mots ou expressions clés à valoriser, mais si on se limite à en faire le sujet de la page, c’est une utilisation a minima dans l’optimisation on-page.
Synonymes et variantes proches
Avec plus de 6 milliards de recherches par jour, Google possède une mine d’informations qui lui permet de déterminer ce à quoi pensent réellement les internautes lorsqu’ils tapent leurs requêtes. Les recherches faites par la firme elle-même démontrent que les synonymes jouent véritablement un rôle dans près de 70 % des recherches.
Les moteurs de recherche utilisent ces vastes banques de vocabulaire faites de synonymes, de variantes proches, de milliards de syntagmes associés par champs lexicaux, qui sont autant de références entre contenus et requêtes qui sont prises en compte lorsque les internautes frappent sur leur clavier d’autres termes que ceux utilisés dans votre article.
On constate que Google renvoie les résultats associés aux vocables de la même famille. Par exemple, pour la requête « photos de chiens » :
- Photos de chiens • Représentations de chiens • images de chien • Photos de canins • Photode chien mignon
Notez que si l’on tape la requête sous les termes chien qui court, cela signifie tout autre chose, et les résultats de recherche montrent que la distinction est bien faite dans les résultats proposés.
(Syntagme = groupe de mots constituant une unité syntaxique)
Vu sous l’angle de la SEO, cela signifie qu’il faudra créer du contenu qui contienne à la fois l’expression clé déterminée, du vocabulaire connexe courant et des variations (+ dérivés), plutôt que de s’en tenir à employer toujours les mêmes mots clés, comme le font encore les fameux bourrins.
Le fait d’utiliser des variantes des mots clés va, par ailleurs, apporter une dimension sémantique plus riche et supprimer les risques d’ambiguïté, alors que le même mot clé pourrait faire référence à plusieurs concepts différents.
Prenons l’exemple du terme avocat qui a besoin d’être contextualisé au risque de rester dans une page qui traitera à la fois du fruit et du métier.
Aujourd’hui, le filtre algorithmique Colibri de Google a recours à la cooccurrence pour identifier les synonymes afin de remplacer les mots dans les recherches.
Sous Colibri, la cooccurrence est utilisée pour identifier des mots qui peuvent être synonymes dans certains contextes, tout en suivant certaines règles selon lesquelles la sélection d’une certaine page en réponse à une demande où une telle substitution a eu lieu présente un niveau de probabilité plus élevé.
Bill Slawski
Segmentation de la page
Chaque page Web est composée de différentes sections: les titres, les pieds de page, les marges, etc. Pendant longtemps, les moteurs de recherche ont cherché à déterminer la section la plus importante de telle ou telle page. Microsoft et Google détiennent tous les deux de nombreux brevets qui indiquent qu’ils considèrent que le contenu situé dans les sections les plus pertinentes du HTML a plus de poids.
Le contenu situé dans le corps du texte semble avoir plus d’importance que le texte placé dans les marges, d’ailleurs, le texte répété placé aux endroits où il est re-plublié d’une page à l’autre risque de passer encore plus inaperçu. (side barre, big footer, pied de page, entête).
On voit encore énormément de liens redondants (avec répétition de mots clés dans l’ancre) et de répétition de l’offre du site placés en big footers, sans compter le contenu des side barre et du pied de page
La segmentation des pages est d’autant plus importante que l’utilisation des appareils mobiles et tablettes croît. Sur ces appareils, bien souvent, une partie de la page est cachée ou le contenu se réorganise au profit du corps de la page. Les moteurs de recherche veulent présenter aux utilisateurs le contenu des portions de vos pages qui sont visibles et importantes, c’est pourquoi le texte contenu dans ces zones-là mérite qu’on y porte la plus grande attention.
Pour aller plus loin, HTML5 intégre des balises sémantiques à implanter, telles que <article>, <aside> et <nav>, qui permettent de définir clairement les sections de votre page Web, ne vous en privez pas.
Distance sémantique et liens entre les termes
Comment les moteurs de recherche peuvent-ils savoir que « labrador » fait référence à une « race de chien » lorsque ces deux syntagmes ne sont pas dans la même phrase?
Ils résolvent ce problème en mesurant la distance entre les mots et les syntagmes à l’intérieur de différents éléments HTML.
Plus les concepts sont proches sur le plan sémantique, plus ils peuvent être liés dans une même phrase, un même paragraphe ou un petit chapitre.
De plus, les éléments HTML (<h>, <li>…) peuvent réduire la distance sémantique entre certains concepts, et donc « les rapprocher ». Par exemple, on peut considérer que la distance séparant les éléments d’une liste est la même entre chaque élément, et que « le titre d’un document est proche de tous les autres termes du document ».
Et les micro-formats?
Schema.org. est incontournable, Schema markup permet de structurer sémantiquement des sections de votre texte de telle façon que cela définisse clairement la relation entre les termes.
Le grand avantage de ces signaux normalisés, c’est qu’ils ne laissent plus aucun travail de devinette aux moteurs de recherche. Les liens sont clairement définis. En revanche, ils nécessitent l’intervention de webmestres éclairés pour implanter ces balises spéciales. Jusqu’à présent, les études ont démontré qu’elles étaient peu utilisées.
Ce qui laisse une avance aux sites initiés.
D’autres concepts énumérés ici peuvent fonctionner sur n’importe quelle page contenant du texte.
Cooccurrence et indexation basée sur les syntagmes
Jusque-là, nous avons parlé des mots clés individuels et de leur relation sémantique. Les moteurs de recherche ont aussi recours à certains calculs pour indexer les pages selon des syntagmes entiers, ainsi que pour hiérarchiser les pages en fonction de la pertinence de ces syntagmes.
Ce procédé est désigné par l’expresssion l’indexation basée sur les syntagmes.
Ce qui est intéressant, dans ce procédé, ce n’est pas la façon dont Google détermine quels sont les syntagmes importants d’une page Web, mais la manière dont il utilise ces syntagmes pour hiérarchiser une page Web en fonction de leur pertinence.
En utilisant le concept de la cooccurrence, les moteurs de recherche savent que certains syntagmes appellent à en prédire d’autres. Si, par exemple, votre sujet traite principalement de « Marie France Bazzo », ce groupe de 3 mots apparaîtra souvent associé à d’autres tels que « Et quoi encore », « Bazzo.tv » ou « Radio Canada ». Une page qui contient ces termes connexes a en effet plus de chance de se rapporter à la journaliste/animatrice qu’une page qui ne contient aucun terme connexe.
Ajoutez à ceci des liens entrants venant de pages contenant des syntagmes connexes, cooccurrents, et vous aurez donné à votre page de puissantes balises contextuelles!
Prédominance de l’entité
Orientés vers l’avenir, les moteurs de recherche explorent mille et une façons d’utiliser les liens, les relations sémantiques entre les entités, et non pas simplement les mots clés, afin de déterminer la pertinence thématique.
Une de ces techniques, publiée dans un travail de recherche de Google, explique la méthode d’attribution de la pertinence par la prédominance de l’entité.
La prédominance de l’entité va au-delà des techniques traditionnelles de recherche de mots clés, comme la TF-IDF, pour repérer les termes pertinents dans un document, en tirant profit des liens connus existant entre les entités. Une entité peut être n’importe quoi dans le document qui est distinct et bien défini.
Plus le lien est fort entre les entités d’une même page, plus cette entité revêt d’importance.
Dans un article qui contient les termes Iron Man, Tony Stark, Pepper Potts et Science-Fiction. Le mot clé « Comics Marvel » a un lien d’entité fort avec tous ces vocables. Même s’il n’apparaît qu’une seule fois, il a de bonnes chances d’être important dans le document.
En revanche, pour ce qui est de « StarCité », même s’il figure plusieurs fois dans l’article (parce que le film est passé dans ces cinémas), le mot clé ayant des liens d’entité plus faibles sera probablement moins important aux « yeux »de Google
Conseils pratiques pour une meilleure optimisation on-page
Alors que l’on évolue de l’attribution de mots clés à des procédés plus avancés dans le ciblage thématique, il est en fait facile d’intégrer ces concepts dans notre contenu. Même si la plupart d’entre nous ne disposent pas de moyens pour calculer les liens sémantiques entre les occurrences d’entités, certaines méthodes simples peuvent s’avérer utiles pour optimiser du contenu :
- Recherche de mots clés pour former votre base.
Même si les mots clés ne suffisent plus à eux seuls pour former la base de votre contenu, tout débute par une recherche scrupuleuse de mots clés. Il vous faut connaître quels termes vous ciblez, la concurrence relative entre ces mots clés, et leur popularité. En bref, votre objectif est d’établir un lien entre votre contenu et les mots clés tels qu’ils sont entrés généralement par les internautes dans le champ de recherche. - Recherche autour de thèmes ou sujets.
Retenez-vous de chercher des mots clés individuels, mais essayez plutôt de définir vos thèmes par mots clés. Recherchez des mots clés secondaires, liés à chaque mot clé que vous aurez trouvé. Lorsque les gens parlent de votre sujet, quels mots emploient-ils pour s’y référer?
Qu’est-ce qui caractérise votre sujet? Servez-vous de ces syntagmes clés pour élaborer du contenu à partir de votre thème central. - En produisant votre contenu, répondez au plus grand nombre de questions possible.
Un bon contenu en est un qui répond à des questions, et la pertinence sémantique doit être étudiée en fonction de cela. Le meilleur classement pour n’importe quelle recherche suppose que le moteur de recherche se fie à votre contenu comme étant celui qui répond le mieux à la question.
Tandis que vous structurez votre contenu autour de thèmes et de sujets, assurez-vous que vous méritez bien le meilleur classement en répondant aux questions et en offrant une expérience utilisateur meilleure que vos compétiteurs. - Utilisez à la fois le langage le plus courant et des variations.
Au cours du processus de recherche de mots clés, il est utile d’identifier d’autres termes courants que les chercheurs utilisent pour parler de votre sujet, et intégrez-les dans votre contenu lorsque c’est possible. Une recherche sémantique de mots clés (champ lexical) s’avère très précieuse au cours de ce processus. - Placez votre contenu important dans les sections les plus importantes.
Évitez les pieds de page et les marges pour le contenu important. N’essayez pas de biaiser les moteurs de recherche avec des astuces CSS ou JavaScript fantaisistes. Votre contenu essentiel doit se trouver là où il est le plus visible et accessible aux lecteurs; dans le corps du texte - Structurez votre contenu de manière appropriée.
Titres, paragraphes, listes et tableaux donnent de la structure au contenu qui permet aux moteurs de recherche de comprendre votre ciblage thématique. Une page Web claire contient une structure similaire à celle d’un bon travail de recherche universitaire.
Peaufinez votre introduction, votre conclusion, la structure des paragraphes en fonction des différents sujets abordés, l’orthographe et la grammaire, et citez vos sources de manière appropriée.
En fin de compte, il n’est pas nécessaire d’avoir un ordinateur ultra sophistiqué pour améliorer notre contenu, ou le rendre plus facile à comprendre. Il suffit d’écrire comme des humains pour des humains pour que notre contenu Websoit en grande partie optimisé pour les moteurs de recherche.
Et vous ?
Quels sont vos meilleurs conseils pour la SEO on-page et le ciblage thématique?
Un article librement adapté de http://moz.com/blog/7-advanced-seo-concepts et raduit librement par Kristof, directeur et consultant de Référencement-PME, agence SEO à Montréal .
N’hésitez pas à commenter!
Monnier says
Merci pour votre bon commentaire Kristof, c’est très instructif et ce sera aussi sans doute intéressant pour tous les SEO, pour la simple raison que la rédaction de qualité c’est encore une sacrée bête noire, surtout pour les débutants.
Arnaud says
Merci pour l’article, du bon contenu, bien rédigé !
Ezaoura says
Bonjour Kristof,
Te lire est toujours un plaisir, c’est de plus la garantie d’un apprentissage pointu. Merci pour ton esprit de partage, ta pratique, ton expérience vaut de l’or.
val says
Vraiment intéressant complet et bien écrit.
Il est vrai qu’il y a des notions très pointues mais c’est cet ensemble de détails qui font que ça marche derrière.
Jean-Claude says
Bonjour Kristof
J’ai une question qui peut sembler hors sujet
Je remarque que vos articles sont excessivement longs, ils vont dans des détails qui semblent très professionnels et pas facile à assimiler. Pourquoi si long ? On lit partout qu’un article doit faire 300 mots et que cela suffit pour Google
Il y a ici au moins de quoi faire 7 ou 8 articles , ne serait-ce pas mieux pour votre « production de contenu » ?
Cordialement
Michèle says
Bonjour Kristof,
Il est vrai que vous entrez dans des notions assez pointues et j’ai du mal à croire qu’il faille respecter 100% des paramètres décrits ici pour faire sortir une page.
Cela dit, l’article présente l’avantage de démontrer les différents mécanismes qui entrent en mouvement lorsque les moteurs analysent un papier.
Merci pour votre travail de partage
Kristof says
@ Jean Claude:
La référence de 300 mots, ha oui! c est devenu le standard des articles de blogues , je dois dire que je ne sais pas vraiment d’où cela vient.
Selon moi, page fondatrices , articles de soutien, seule la qualité du traitement du sujet doit compter et si cela doit prendre 2500 mots …et bien soit, le lectur en aura pour son argent. Ne comptez pas, donnez votre savoir, partagez votre opinion, soyez généreux.
@ Michèle
Non il n’est pas besoin de respecter 100% des recommandations citées ici, donnez-vous seulement la chance d’en respecter un maximum selon votre contexte et vous aurez de l’avance sur les autres. Il n’y a pas d’article parfait…
@ Francis, @Val, @ Ezaoura, @ Arnaud
Merci pour vos commentaires encourageants.
Francis Bélime says
Très bons conseils de Kristof…
Les pratiquer, c’est s’assurer de la visibilité que vous méritez sur le web !