L’éditeur veille à la fiabilité des informations publiées, lesquelles ne pourraient toutefois engager sa responsabilité.
Aucun extrait de cette publication ne peut être reproduit, introduit dans un système de récupération ou transféré électroniquement, mécaniquement ou sous toute autre forme, sans l’autorisation préalable écrite de l’éditeur.
Editeur responsable : Luca Venanzi
Copyright © 2013 by Edi.pro
www.edipro.eu
© Version numérique Primento et Edi.pro
ISBN : 978-2-511-01423-3
Ce livre a été réalisé par Primento, le partenaire numérique des éditeurs
Cette édition numérique a été publiée avec le soutien de la Fédération Wallonie-Bruxelles.
Le présent ouvrage n’aurait probablement pas vu le jour sans le concours direct ou indirect de nombreuses personnes. Qu’il me soit ici permis d’en remercier quelques-unes et pardonné d’en laisser tant d’autres dans l’ombre.
Merci à Luca Venanzi de son ouverture et de l’accueil enthousiaste qu’il a réservé au sujet.
Merci à Olivier Matz, de m’avoir mis en relation avec Luca Venanzi.
Merci à Jérôme Jamin, Grégory Van Ass, Théo Collignon, Geneviève Smal, Marc-Alexandre Legrain, Joël Michiels, Sébastien Assouad, Edouard Dejardin, Alain Leroy et toutes les personnes qui ont contribué, chacune à leur manière, à influencer ma vision du business, des gens, et de la vie.
Merci aux personnes que je rencontre sur le web et qui prennent la peine de commenter, partager, soutenir ou critiquer ma vision.
Merci à toutes les personnes qui croisent mon chemin en conférences, séminaires ou formations, et qui souvent témoignent de leur expérience et avec lesquelles je garde fréquemment des contacts enrichissants.
Merci à Sylvie Laudier, Gaëlle Gozzi et Grégory Van Ass de leur relecture attentive, constructive et bienveillante.
Merci à Sylvain Lauwers d’avoir réalisé les illustrations de cet ouvrage. Découvrez son univers sur son blog : www.sylvainlauwers.be.
Merci à mes parents d’avoir toujours soutenu mes démarches, peu importe que la finalité leur soit apparue claire ou floue.
Merci à mon épouse Christelle et à mon fils Livio de supporter mes absences trop nombreuses et de m’avoir offert la tranquillité d’esprit nécessaire à mon engagement dans une démarche telle la rédaction d’un ouvrage.
Merci enfin à vous, lectrice, lecteur, de votre intérêt pour le thème et d’accepter de passer quelques heures de votre temps en ma compagnie sur ce sujet passionnant.
Puisse ce livre vous apporter des réponses et vous aider au quotidien dans votre approche du référencement et de la visibilité sur le web.
J’ai écrit ce livre pour mon fils, Livio.
Puisse-t-il être fier de son papa quand il sera plus grand et trouver une utilité à cet ouvrage, même s’il s’agit pour lui de colorier les dessins qui illustrent le propos.
« L’important n’est pas de convaincre, mais de donner à réfléchir », Isidore Katzenberg, personnage du roman de WERBER B., Le père de nos pères, Albin Michel, 1998, p.375.
L’essor de l’internet, l’explosion du nombre de pages web, les pratiques nouvelles nées de la déferlante 2.0 rendent à la fois la visibilité nécessaire et de plus en plus complexe à obtenir. Tout le monde utilise l’internet, il faut y être. Mais puisque de plus en plus de monde s’y trouve déjà, il faut être plus visible que les autres, vos concurrents en tête !
Plusieurs méthodes vous aident à travailler votre visibilité sur le web : référencement naturel, e-marketing, occupation du terrain dans les médias sociaux… Toutes ces recettes, bien exploitées et mises en œuvre, peuvent fonctionner pour vous faire sortir du lot. La seule qui fonctionne mal, c’est l’improvisation. Vous commettez une grave erreur si vous croyez, comme Jean-Claude Dusse, que « sur un malentendu, ça peut marcher »1.
Bien sur, le référencement et la visibilité sur le web sont des matières techniques. Néanmoins, une grande part de ces disciplines reposent sur des concepts proches des « bonnes pratiques », tendant même vers la compréhension d’une certaine philosophie de l’approche : concevoir des pages « optimisées » pour le référencement, écrire pour le web, améliorer la visibilité d’un site… Le cadre de travail dépasse la seule vision technique.
Certaines pratiques de référencement ont d’ailleurs souvent peu de liens avec la technique pure : elles relèvent plus d’une démarche de bon sens résultant de la compréhension de cette discipline, ses contours, ses limites et ses enjeux. Ne vous méprenez pas : bon sens ne signifie pas pour autant évidence. Certaines pratiques ne peuvent apparaître claires qu’après une immersion spécifique dans la logique du web, du référencement et de la visibilité.
Lorsque vous pensez le web en termes de visibilité, la réalité se déforme et le web change de dimension : vous le voyez sous un autre angle et lui aussi, en tant qu’univers qui fonctionne suivant ses propres codes, règles et valeurs vous perçoit différemment dès lors que vous cherchez à le comprendre et à lui plaire.
A l’heure actuelle, cette lecture des éléments à travers le prisme particulier du web constitue un enjeu déterminant pour tout acteur professionnel, individu ou entreprise, en quête de visibilité en ligne.
Cet ouvrage poursuit l’objectif de vous entraîner vers un segment spécifique de la planète Internet. Plutôt qu’une encyclopédie, les lignes que vous lisez vous feront entrer dans une nouvelle culture : celle du référencement, de l’e-marketing et de la visibilité. Au lieu de viser la complexité et chercher l’exhaustivité en la matière, l’objectif recherché consiste à vous emmener dans la logique et le fonctionnement du référencement, de l’e-marketing et de la visibilité.
Au-delà des conjonctures, ce livre souhaite vous mettre « sur les bons rails » pour entreprendre les démarches qui vous sembleront bonnes. Sur base des clés de compréhension que vous aurez acquises, vous pourrez aussi éviter les pièges. Les mauvaises pratiques sont nombreuses, et vous pouvez lire sur le web tout et son contraire. Ce livre vous permettra de vous positionner en connaissance de cause.
Inévitablement, certains points abordés évolueront : la thématique bouge tellement vite ! Cependant, l’état d’esprit restera stable. C’est cette vision du référencement et de la visibilité sur le web que ce livre souhaite vous transmettre.
Vous avez donc en main un guide pratique destiné à vous aider dans votre utilisation professionnelle du web à des fins de promotion personnelle – personal branding - ou de votre entreprise. Ce fut ma motivation tout au long du processus d’écriture.
Ce livre est articulé comme suit :
1ère partie : |
le référencement, définition et enjeux |
2ème partie : |
30 pratiques de référencement et d’e-marketing pour booster la visibilité de vos pages web |
Conclusion : |
vers une visibilité 2.0 |
Nous aborderons donc les 3 thèmes du référencement, du webmarketing et de la visibilité, avec pour lame de fond la présence dans les moteurs de recherche, dont les 3 ténors sont Google, Yahoo Search, et Bing (ex-Live Search).
En conclusion, ce livre traitera des pistes actuelles pour créer et augmenter encore votre visibilité, en occupant le terrain. Vous verrez qu’il est désormais insuffisant de vous reposer exclusivement sur votre site web : il convient, pour doper son exploitation, de le montrer là où votre cible se trouve. Le temps où les internautes venaient vous chercher est loin : vous devez être là où ils sont et où ils vont ! C’est ce que j’appelle la « visibilité 2.0 ».
Le livre se situe à la croisée des chemins :
Ce guide pratique se positionne aussi à une intersection. Volontairement, il concerne :
Ce guide vous présente 30 pratiques. De manière pragmatique, elles sont réparties équitablement entre les décideurs et les webmasters. Dans la réalité, elles forment un tout difficilement dissociable.
Aussi, vous, décideur aurez tout intérêt à lire les pratiques un peu plus techniques à l’attention des webmasters. Vous pourrez mieux comprendre leur travail et interagir avec eux; vous disposerez également d’un moyen de contrôler leurs actions et leur mise en œuvre dans le cadre d’une approche orientée référencement (souvenez-vous toujours que certains webmasters n’ont pas de notions de référencement, même s’ils vous assurent du contraire). Enfin, vous pourrez entreprendre de nombreuses démarches par vous-même pour améliorer la visibilité de vos pages web dans les moteurs de recherche.
Vous, webmaster, pouvez utilement apprendre des pratiques à l’attention des décideurs : vous y trouverez des conseils à donner à vos clients (des décideurs, justement !) Vous découvrirez des outils simples à mettre directement en place dans votre méthodologie de travail. Vous aurez des arguments pour convaincre vos clients de leur indispensable implication dans la visibilité de leurs pages web.
Que vous soyez décideur ou webmaster, améliorer la visibilité de vos pages web constitue un objectif que les 30 pratiques de ce livre, dans leur ensemble, vous permettront d’atteindre.
1 Jean-Claude Dusse est un personnage de la trilogie des « Bronzés », films de Patrice Leconte, incarné par l’acteur Michel Blanc, de la troupe du Splendid.
L’économie se mondialise. Les frontières tendent à disparaître. Tous les jours, la presse ramène à nos yeux combien la concurrence est féroce à travers le monde. En vous rendant sur www.worldometer.info, vous trouvez les chiffres suivants (collectés le 23 mars 2010 à 22h05) :
Dans une économie mondialisée, ces chiffres donnent le vertige. Malgré cela, il est UNE chose qui vous intéresse par dessus tout : vous rendre visible sur Internet dans ce contexte !
Voilà maintenant 20 ans que je travaille professionnellement dans l’informatique, dont presque 10 ans chez Microsoft. Pendant toutes ces années, j’ai parcouru le monde afin de conseiller mes clients (des sociétés multinationales) sur les tendances de marché, les évolutions majeures et les innovations. Mes clients sont toujours accompagnés de leur meilleur expert. Tout est très nouveau : on crée, on invente. Malheureusement, rien de ce que nous abordons ne figure dans un quelconque ouvrage. La réflexion et la progression de chacun se font par le contact entre pairs.
Par contre, au niveau des PME, les conversations s’ajustent. Les interlocuteurs sont des hommes-orchestres, des chefs d’entreprise qui doivent gérer :
Lorsque je leur prodigue des conseils, je dois ajuster mon langage faute de quoi ils me rétorquent : « Là, Alain, tu parles chinois » ! Manifestement, mon vocabulaire et mon expertise ont évolué pour répondre à ce nouvel état d’esprit.
Etonnamment, ici aussi, il apparaît très difficile, même après recherches, de trouver des ouvrages qui expliquent simplement les réalités parfois complexes qui se cachent derrière la technologie !
Parcourant les centres de compétences wallons, j’ai eu le plaisir de rencontrer Fred, l’auteur de cet ouvrage. Ce qui m’a surpris dès nos premiers échanges, c’est la facilité avec laquelle il exprime des choses complexes avec des mots simples.
Par la lecture, les échanges communautaires et les nombreuses conférences auxquelles il participe, Fred a construit son expertise. Il a collecté, rassemblé et synthétisé un immense savoir lié au fonctionnement des moteurs de recherche et aux mécanismes de l’Internet.
Ce savoir, Fred le partage en missions de conseil et au cours de nombreuses sessions de formation. Délivrées avec clarté et efficacité, elles sont fortement plébiscitées. Les mots sont bien choisis, les exemples parlants, et les anecdotes sonnent « vrai » à nos oreilles! Les participants accueillent ses explications avec enthousiasme et amènent de nouvelles questions. Ces partages d’expériences l’enrichissent pour de nouvelles présentations ! Intelligence collective, direz-vous ? Un autre thème autour duquel Fred et moi collaborons !
Dans cet ouvrage, vous retrouvez la version textuelle des conférences de Fred sur le référencement et la visibilité web. Phrase après phrase, on entend l’orateur : sa voix s’insinue dans notre esprit, son humour vous fait sourire, les anecdotes qu’il partage prennent forme sous vos yeux. Ce livre est réellement un concentré de savoir, simplement exprimé. Ce que j’avais du mal à trouver, vous l’avez entre les mains !
Cet ouvrage n’a pas l’ambition d’être exhaustif. Il n’est pas non plus destiné à l’expert du référencement. Cet ouvrage est l’essence même de ce que vous devez savoir, vous, le patron de PME, pour créer votre site, le faire vivre et le faire voir avec l’aide éventuelle de votre webmaster et de votre graphiste. Oui, graphiste qui faites du web et webmaster, sentez-vous également concerné par cet ouvrage.
Que vous vouliez faire le tri entre vrai et le faux, vous former au référencement ou simplement disposer d’un aide-mémoire qui assœira vos connaissances, je vous invite à lire les pages qui suivent ! Si tous les sites web respectaient ces principes élémentaires, le web serait encore plus pertinent, fonctionnel et percutant.
Ce livre est écrit dans un langage compréhensible du néophyte. Cerise sur le gâteau, il comprend en grande majorité des conseils faciles à mettre en œuvre tout en étant redoutablement efficaces!
Vous trouverez donc, dans ces quelques pages, un concentré du savoir essentiel pour atteindre votre but, être “UN parmi des milliards : VOUS”.
Je vous souhaite une excellente lecture !
Your CIO ad interim
http://be.linkedin.com/in/alainler
Avec le temps et la vitesse d’évolution du web et de ses acteurs (les moteurs de recherche en l’occurrence), le référencement est devenu une discipline complexe, qui recouvre plusieurs aspects. En présenter chaque facette vous aidera à bien comprendre son fonctionnement à l’heure actuelle.
Vous verrez : vous avez tout à y gagner ! En saisissant les différents éléments du référencement :
Le référencement naturel, qualifié aussi d’organique, désigne le processus qui aboutit au classement de vos pages dans les résultats de recherche : la sélection, le tri et la présentation des résultats dans un certain ordre correspond à cette notion de positionnement « naturel » effectué par le moteur de recherche. C’est lui qui décide quelles pages il affiche et vous ne pouvez prétendre « vous imposer » en 1ère place.
Dès lors, et par extension, « travailler le référencement naturel » de vos pages web correspond à ce que les anglo-saxons appellent SEO (Search Engine Optimization). Il s’agit de déployer un ensemble de techniques afin de présenter une page web sous son meilleur jour (« l’optimiser ») pour le moteur de recherche : codage propre de la page, insertion de mots-clés pertinents, bonne exploitation des liens… De nombreux critères plaisent au moteur de recherche. La plupart des pratiques exposées dans la 2ème partie de ce livre ont pour objectif d’améliorer votre référencement naturel.
Avec le temps, les moteurs de recherche sont devenus de plus en plus exigeants et pointilleux, pour 2 raisons :
Aujourd’hui, plus de 200 critères entrent en ligne de compte lorsque le moteur de recherche analyse vos pages web. Il est difficile d’en faire le tour de manière exhaustive pour les raisons suivantes :
Comprendre et pratiquer le référencement naturel, c’est donc s’imprégner de sa « culture » et adopter la vision des moteurs de recherche. A l’heure actuelle, il constitue le meilleur moyen de donner une visibilité durable à vos pages web dans les résultats de recherche des moteurs. Voyons donc ensemble comment il fonctionne.
En réalité, le référencement naturel se définit par rapport au référencement payant qui sera traité dans la 2ème partie du livre, à la pratique « Utilisez les liens sponsorisés ». Ce que l’on appelle référencement naturel (au sens large) regroupe 3 sous-ensembles distincts mais étroitement complémentaires :
Ces 3 éléments constituent les ingrédients indissociables et indispensables à la compréhension du référencement. Analysons-les en détails.
Le référencement n’a pas attendu le web et les moteurs de recherche pour exister ! Étymologiquement en effet, il traduit l’action visant à mentionner une chose ou un individu, à y faire référence 1. « Référencer quelqu’un » signifiait donc transmettre ses coordonnées à une tierce personne. Le recommander, en quelque sorte. Lorsque vous remettez la carte de visite de votre courtier en assurances à un ami en lui disant : « tu peux l’appeler de ma part, il est très bien », vous référencez votre courtier à votre ami.
Historiquement, et suivant cette logique, le référencement sur le web a d’abord désigné toutes les actions consistant à faire des liens vers une ressource. En liant 2 pages web entre elles, vous procédiez à du référencement !
La thématique a considérablement évolué et s’est élargie aux stratégies e-marketing et la problématique de la visibilité sur le web. Le référencement est devenu complexe et englobe désormais toutes les démarches :
Cette 3ème étape est fondamentale dans la gestion d’un projet web. De fait, si les 2 premières démarches s’appuient sur des pages existantes et déjà créées (qui seront promues et mises en avant de manière stratégique), la 3ème repose intrinsèquement sur chaque page elle-même :
Dès la phase de conception des pages web, le référencement intervient donc et doit être pris en considération. « Faire du référencement », au sens strict, signifie donc créer la meilleure page web qui soit pour le moteur de recherche… et l’utilisateur ! Vous pouvez offrir la meilleure page web du monde pour le moteur de recherche, si cette page est sans intérêt pour l’internaute qui la visite, elle est inutile !
Ayez en permanence à l’esprit cette nécessité de plaire aux moteurs de recherche et à vos utilisateurs. Ils sont indissociables. D’ailleurs, lorsque vous lirez les pratiques pour y parvenir, vous constaterez que plaire à l’un a souvent pour conséquence de plaire à l’autre. Et c’est une bonne chose puisque vous pourrez faire d’une pierre 2 coups. En accomplissant avec succès ces démarches, vous gagnerez en visibilité, l’enjeu ultime de toute présence web efficace !
Nous verrons comment préparer efficacement une page web (et un site) pour le passage des robots des moteurs de recherche, dont l’exercice favori est l’indexation des contenus. Retenez pour l’heure que le référencement constitue la 1ère démarche de votre stratégie web… Et dire que vous aviez cru que vous pourriez vous « attaquer » au référencement en toute fin de projet, une fois votre site web en ligne ! Les pages qui suivent et les pratiques vous démontreront combien vous avez à gagner à considérer le référencement avant même le début du projet.
Abordons à présent la manière dont le moteur de recherche découvre et analyse une page web.
Les mécanismes de référencement au sens strict s’articulent sur la conception de pages web bien faites et leur signalement aux moteurs de recherche et autres ressources pertinentes.
Dans le processus d’indexation, ce ne sont plus les pages web que vous présentez aux moteurs de recherche, ce sont les moteurs de recherche qui viennent voir vos pages web !
Comprendre ce fonctionnement constitue un point crucial de la démarche de visibilité dans les moteurs de recherche. Vous pouvez entreprendre les actions qui vous rendront visibles dans les moteurs, encore faut-il que ces derniers s’intéressent à vous ! Et lorsque leur attention est retenue par vos pages, celles-ci doivent être efficaces et faciles à analyser pour que le moteur enregistre beaucoup d’informations (et des informations correctes) à leur sujet ! Le raisonnement vaut également en sens inverse : vous pouvez négliger de promouvoir vos pages auprès des moteurs ; ils sont susceptibles d’y prêter attention malgré tout !
Dans les 2 cas, soyez rassuré : les moteurs de recherche ont pour mission de s’intéresser aux contenus des pages web. Il en va de leur crédibilité aux yeux des utilisateurs. Ils ont donc tout intérêt à venir voir vos pages et en extraire les informations de valeur. C’est précisément la tâche dévolue aux robots d’indexation.
Les robots d’indexation sont des logiciels conçus par les moteurs de recherche pour accomplir une mission : parcourir le web, encore et encore, 7 jours sur 7, 24 heures sur 24, pour visiter le plus de pages web possible, les scanner et en extraire le contenu pertinent. Ces robots d’indexation portent plusieurs dénominations : bots, web crawlers (chenilles du web) ou web spiders (araignées du web). Leur fonctionnement repose sur l’analyse des contenus.
Dans une page web de toute nature (site, blog, forum, réseau social ou autre), le robot d’indexation repère les mots-clés pertinents et les expressions qu’il juge significatives. C’est la raison pour laquelle vous entendez tellement parler de l’importance et du choix des mots-clés ! Nous reviendrons sur la notion même de mots-clés et d’expressions significatives : plusieurs pratiques y sont consacrées.
Le robot d’indexation va plus loin. Il collecte également des informations sur une série de ressources connexes aux pages web proprement dites : liens, images, documents (ex : word, excel, pdf…), fichiers audio (ex : mp3…) ou vidéos constituent autant d’éléments auxquels le robot va prêter attention. Il est donc crucial de les préparer, eux aussi, à l’indexation en travaillant leur référencement2.
Pour trouver et indexer le contenu d’une page web, le robot d’indexation respecte un principe simple : il procède par visite récursive des hyperliens.
Les hyperliens forment le cœur d’Internet : une source (mot seul, expression ou encore image) constitue une unité d’informations cliquable qui amène vers une cible, une destination (mot seul, expression, image, fichier audio ou vidéo, document). Le lien entre ces 2 ancres est le protocole utilisé, l’hypertexte. A titre illustratif, l’historique texte cliquable écrit en bleu et souligné est un lien hypertexte. Un hyperlien donc !
Le robot d’indexation est attentif aux liens dans une page web : ce sont eux qui lui permettent de parcourir les autres pages. Il passe de l’une à l’autre et en découvre de nouvelles.
La récursivité, quant à elle, souligne le caractère répétitif de l’opération à chaque niveau. Le robot d’indexation fonctionne en boucle : en permanence, il visite les pages web et suit les liens qu’il y trouve pour découvrir d’autres pages web. Ad libitum, comme dirait le mélomane. A chaque fois qu’il trouve un lien, il l’explore en reprenant le même processus et exécute à nouveau l’opération à des niveaux de plus en plus profonds. C’est ce qui distingue la récursivité de la simple répétition : le robot applique à chaque lien la même logique de traitement, de manière horizontale et verticale.
Outre ce principe, les robots d’indexation se conforment à d’autres règles, dont 2 méritent qu’on s’y attarde3.
Tout d’abord, en vertu du principe de sélection, le robot exécute un tri dans les pages qu’il va indexer. Voilà bien une source de frustration énorme : il est parfois impossible de comprendre la raison pour laquelle le robot n’indexe pas une page ! A croire que le robot semble doté d’une certaine faculté de discernement ou, pire, d’une faiblesse humaine comme la paresse ou le manque d’envie. Quoi qu’il en soit, le robot sélectionne les pages qu’il télécharge. Dans ce processus, certaines peuvent être délaissées (rappelez-vous aussi, et soyez rassuré par la même occasion, que le robot a pour mission d’indexer des pages web; dans la majorité des cas, il effectue son travail consciencieusement).
Ensuite, sur base du principe de re-visite, le robot vérifie le rythme des changements sur la page. En clair, il s’assure que le contenu de la page est toujours conforme à celui qu’il a téléchargé et « mis en mémoire », en quelque sorte.
En réalité, les robots d’indexation scannent le contenu de votre page et en stockent une copie sur les serveurs du moteur de recherche pour lequel ils oeuvrent. Vous imaginiez vraiment que le moteur de recherche balayait tout le web en 0,15 secondes pour vous afficher 150 000 résultats ? C’est également la raison pour laquelle, dans certains cas, il y a des discordances entre le contenu réel de votre page et celui proposé par le moteur : il vous envoie vers une page alors qu’elle n’existe plus ou a été déplacée (erreur 404) ou renseigne des informations qui ont changé. Le moteur mettra ses informations à jour lors de la prochaine visite du robot sur votre page web.
Il relève donc de la plus haute importance que le contenu indexé par le robot soit le plus proche du contenu réel et surtout actuel de vos pages web. Ce constat a fait naître 2 croyances infondées.
Les robots d’indexation ont considérablement progressé au fil du temps. Ils se sont notamment très bien adaptés à l’évolution des critères à prendre en considération lors de l’examen d’une page web. Ils font également preuve d’une bonne capacité de pondération entre tous les éléments d’attention qui déterminent la pertinence du contenu d’une page web.
Cependant, les robots d’indexation restent des outils informatiques. Ils sont avancés, certes. Ils n’en demeurent pas moins des logiciels et fonctionnent comme tels ; ils souffrent logiquement de quelques limitations qui entravent, volontairement ou non, l’indexation d’une page web.
Les sites web dits « dynamiques » s’appuient sur une architecture technique qui peut compliquer la tâche du robot d’indexation. Ainsi, les URL (Uniform Ressource Locator, c’est-à-dire les adresses web accessibles via le protocole http5) générées dynamiquement appellent des variables qui rendent l’adresse elle-même difficile à décrypter par le moteur de recherche.
Voici un exemple d’URL dynamique :
www.votre-site.com/articles/articles.hp?id=23&page=3&rubrique=5 Les robots d’indexation ont du mal à comprendre les adresses de ce type (vous aussi, d’ailleurs, probablement). Voyez la pratique « Utilisez l’URL rewriting » pour le détail de fonctionnement et les règles pour des URL efficaces.
La volatilité d’une telle URL embarrasse aussi le robot d’indexation : une URL dynamique peut avoir une durée de vie extrêmement brève. Entre 2 visites du robot, la structure de l’URL peut avoir changé. L’URL générée dynamiquement et indexée à un temps T par le robot peut aussi avoir disparu ; elle n’existe plus. Le robot n’a peut-être « pas eu le temps » d’indexer une URL dont l’existence fut trop courte.
Nous verrons ultérieurement que l’ancienneté d’une URL constitue l’un des critères particulièrement appréciés des moteurs de recherche6. Ces hyperliens temporaires se positionnent comme l’antithèse de cet aspect qui plaît aux moteurs. Je vous expliquerai comment solutionner cette difficulté.
Par essence (grâce à la récursivité), les robots d’indexation fouinent, creusent, cherchent, veulent toujours aller plus loin. Leur objectif : indexer un maximum d’informations. Dans cette logique, ils cherchent à en ingérer le plus possible. Ensuite, ils trient, qualifient et sérient les pages web parcourues (quitte parfois, comme nous l’avons vu, à laisser sur le bord de la route certaines pages web considérées comme insuffisamment pertinentes).
Or, il se peut que vous ne souhaitiez pas que le robot d’indexation accède à tout votre contenu. Il existe peut-être des parties de votre présence web que vous voulez conserver hors de portée des moteurs de recherche. Grâce au fichier robots.txt, vous postez en faction un cerbère qui signalera au robot d’indexation les parties de votre dossier web qu’il peut visiter et celles qui lui sont interdites.
Lors de la découverte d’une nouvelle URL à indexer, les robots d’indexation vérifient avant toute autre chose si un fichier robots.txt est présent à la racine du site web7. Le cas échéant, le robot explore le fichier et se conformera aux instructions renseignées par le webmaster.
Ce dernier pourra spécifier les URL que le robot sera autorisé à visiter (allow). Il renseignera aussi les URL qui font l’objet d’une restriction et que le robot devra, par conséquent, ignorer (disallow).
Le fichier robots.txt se veut donc une limitation somme toute volontaire au fonctionnement du robot d’indexation.
Fréquemment, les moteurs de recherche démontrent leur puissance et leur rapidité à indexer les contenus des pages web. Chaque jour, ils s’améliorent. Cependant, ils demeurent des machines. Certaines pratiques entravent fondamentalement le travail du robot d’indexation, l’empêchant cruellement de jouer son rôle et de remplir sa mission.
Des méthodes de codage des sites web utilisées dans les années 1990 posent aujourd’hui des problèmes pour accéder au contenu de valeur d’une page web. Je vous présenterai ces méthodes à oublier dans les pratiques à l’attention des webmasters (notamment les pratiques « bannissez les frames » et « méfiez-vous du Javascript »).
D’autres embûches, encore plus primaires, peuvent contrarier le robot : certaines pages web semblent en effet conçues pour que le robot ait du mal à atteindre leur contenu. Exiger un identifiant et mot de passe entre dans cette catégorie. Un temps de chargement trop long, peu importe la raison, a aussi un impact sur le fonctionnement du robot d’indexation. Ce dernier peut, comme vous, se montrer impatient et quitter la page avant que le chargement soit terminé. Il abandonne ainsi en cours de route l’opération et, par la même occasion, l’indexation de la page. Vous avez déjà, j’en suis sûr, quitté une page qui vous indiquait un temps de chargement trop long à votre goût !
A ce stade, retenez ceci : plus le robot d’indexation aura des facilités à accéder au contenu d’une page web et le parcourir, plus il y aura de chances qu’il l’indexe rapidement, facilement et efficacement. A l’inverse, plus le robot rencontrera des difficultés à accéder à une page web, plus il aura du mal à en extraire les informations pertinentes et les répertorier dans l’index du moteur de recherche.
Une fois vos pages web visitées par le robot d’indexation, elles seront répertoriées dans l’index du moteur recherche (pour autant qu’elles aient été considérées comme pertinentes bien entendu). Une dernière étape intervient ici dans le processus global de référencement et de visibilité : le positionnement.
Le positionnement, en premier lieu, concerne la gestion de la présence de vos pages dans les pages de résultats de recherche d’un moteur, appelées encore SERP (Search Engine Results Pages). Si vous apparaissez en page 8 des SERP sur les mots-clés sur lesquels vous voulez être visible, votre positionnement est mauvais.
Par définition, le positionnement fait référence à une notion de classement. Plus vous êtes proche des premières places, plus vous êtes susceptible d’être vu, cliqué et visité. Le premier enjeu d’un bon positionnement consiste donc à viser les meilleures positions, les « places en or ».
Figurer parmi les premiers résultats lors d’une recherche sur vos mots-clés est une très bonne chose. Si, en plus, les moteurs retournent plusieurs de vos pages sur la première page de résultats, c’est excellent ! Vous augmentez votre visibilité et déployez une stratégie d’occupation de terrain, second enjeu d’un bon positionnement.