la recherche de documentation sur internet

avertissement

Nombre d'internautes ignorants du fonctionnement d'internet l'utilisent mal et ne savent pas trouver ce qu'ils cherchent. Le but de ce chapitre est donc d'expliquer tous les pièges et les principes qui sont à la base des annuaires et moteurs de recherche afin de pouvoir les utiliser efficacement.

En effet une étude intéressante a été publiée sur le Web (en mai 2008) au sujet des moteurs de recherche, proposée par ASBL Edudoc et le Conseil inter-universitaire francophone (CIUF) qui ont demandé à 1 865 jeunes utilisateurs du Web d'effectuer des recherche documentaires et informationnelles. Note moyenne reçue par nos documentalistes en herbe : 7,67 sur 20 !

Et le fait d'avoir une connexion Internet à domicile n'aide en rien les étudiants à être plus performants dans leurs investigations, bien au contraire. Un travail similaire sur les seuls étudiants canadiens avait, il y a quelques temps, révélé une moyenne de 8,97. Pas top non plus...

Identification, vérification et choix des sources, recherche de supports additionnels (bibliothèques, bases de données documentaires), syntaxe d'interrogation, tous ces concepts semblent totalement occultés, à tel point que certains indiquent même préférer la télévision aux livres pour trouver leurs informations. On croit rêver... Bref, un sujet de réflexion intéressant et important, voire capital, pour l'avenir de nos chères têtes blondes et une vraie nécessité d'enseigner les bases de la recherche et du traitement d'information sur le Web...

les moteurs de recherche

Le principal outil pour trouver une information sur internet c'est le moteur de recherche. Au début de 2008 il en existe sans doute plus d'un millier à votre disposition, mais en pratique vous n'en utiliserez qu'un seul la plupart du temps. Quels sont- ils?

Il en existe en fait 3 catégories : les moteurs généralistes, les moteurs spécialisés, et les moteurs internes à un site web.

Parmi les généralistes on peut citer Google, Yahoo, Bing et Baidu (en Chine) .
Les moteurs spécialisés sont nombreux mais connus des seuls spécialistes du domaine et sont plutôt des annuaires que de véritables moteurs de recherche car ils n'ont en général indexé que les adresses et les noms de site et parfois aussi les descriptions et mots-clés figurant en tête du code source de la page d'accueil du site, mais pas le contenu réel du site.

Le moteur typique intégré à un site et permettant des recherches sur ce seul site c'est évidemment celui de Wikipédia, l'encyclopédie en ligne. En outre nombre de sites placent à l'intérieur de leur site la barre de recherche de Google qui fait évidemment double emploi avec celle qui est déjà intégrée à votre navigateur (dans la plupart des cas aujourd'hui) et ne vous apportera rien de plus puisque c'est la même.

L'une des différences essentielles qui est évidemment liée à la puissance de l'organisation qui se cache derrière le sigle, c'est leur rapidité de mise à jour. Quand vous proposez un nouveau site à Google, deux jours plus tard il a été indexé et on peut le retrouver grâce à Google. Pour d'autres moteurs il faut attendre jusqu'à 3 mois pour voir apparaître un nouveau site dans leur liste. Et bien évidemment si le site subit un lifting il leur faudra à nouveau plus de 3 mois pour le prendre en compte, alors que Google ne mettra jamais plus de 2 ou 3 jours pour prendre en compte vos mises à jour.

Nous prendrons dans la suite l'exemple de Google qui représente en France (et ailleurs) environ 85% des requètes sur internet.

Les annuaires

Divers sites proposent des annuaires classés par spécialités ou par thème. Selon leur importance et leur notoriété les listes de sites par thématique seront plus ou moins longues à balayer. En effet dans un annuaire, c'est comme dans l'annuaire papier de France Télécom les sites sont classés les uns derrière les autres et c'est à vous de balayer l'annuaire jusqu'à trouver ce qui est susceptible de vous intéresser. Pour chaque site l'annuaire vous fournit son adresse et une très courte description le plus souvent les n premiers caractères de la description fournie par le webmaster du site ce qui n'est généralement pas très informatif. Chaque hébergeur dispose d'un annuaire des sites qu'il héberge et de plus en plus il élargit cet annuaire en dehors de son champ propre d'activité.

Certains organismes associés à des compteurs sur les sites inscrits proposent des classements, eux aussi organisés par thématique, en fonction de la fréquentation des sites ce qui permet lorsqu'on cherche un site quelconque dans un domaine précis de sélectionner rapidement ceux qui sont les plus vus et donc vraisemblablement les plus intéressants. Malheureusement ces classements sont biaisés car, d'une part, ils ne concernent que les sites inscrits dans ledit classement et, d'autre part, c'est le webmaster du site qui choisit dans quelle catégorie il va inscrire son site et ainsi divers sites commerciaux peu scrupuleux sont souvent inscrits dans des rubriques parfaitement inappropriées mais plus "porteuses" et encombrent le classement. On trouve ainsi parfois dans une rubrique "art" des sites consacrés à l'astrologie et dans une rubrique "éducation" j'ai rencontré pas moins de 36 sites consacrés aux prénoms!

Le mode de classement varie évidemment selon l'organisme gérant celui-ci et un site inscrit dans plusieurs classements peut ainsi être dans les tous premiers dans un classement et en milieu de tableau dans un autre selon que ce classement va tenir compte du nombre de connexions, mais aussi du nombre de pages vues et du temps passé par les internautes sur ce site et bien sûr selon qu'il enregistrera ou non toutes les connexions. En effet pour qu'une connexion soit enregistrée par un organisme quelconque il faut qu'une information soit envoyée par le site vers cet organisme et en raison de l'encombrement croissant des lignes téléphoniques il arrive de plus en plus souvent que l'internaute passe à une autre page ou un autre site avant que cette information de comptage ne soit parvenue à l'organisme gérant le compteur ce qui va évidemment fausser le classement. Il en résulte que si l'on se limite à un seul annuaire de ce type on risque de passer à côté d'un site qui serait pourtant intéressant.

Pour illustrer ceci je prendrai l'exemple d'Electron mon Amour qui a été inscrit dans 3 classements différents à une certaine époque (afin justement de mettre en évidence les divergences de ces classements) et qui dans la rubrique "éducation" était un même jour classé 7ème chez Weborama, 36ème au Hit-Parade et 63ème dans le classement d'Hebdotop dans la même rubrique. Au début de 2008 Electron mon Amour dispose de plusieurs types de compteurs : celui de l'hébergeur Orange qui est le seul à enregistrer obligatoirement (par construction) toutes les connexions, celui de Xiti qui en enregistre en moyenne plus de 95%, celui de cluster maps testé depuis peu et qui n'en identifie au mieux que 15% et certains jours beaucoup moins, les compteurs de freecompteur.com qui n'enregistrent pas tout non plus mais seulement environ 60% (par rapport à Orange), cette divergence implique donc que la plupart des classements des annuaires ne sont pas exactement représentatifs de la notoriété d'un site mais vont simplement donner une idée de sa notoriété.

les liens dans un site

De nombreux sites web comportent divers liens, plus ou moins classés, vers des sites ayant soit la même thématique, soit liés par une relation amicale entre webmasters. Il n'est que trop rarement aisé de deviner s'ils vont concerner le problème qui vous intéresse, sauf si le webmaster ne se contente pas de mettre un simple logo mais fournit un commentaire précisant la nature du site.

Ces liens peuvent être classés dans une page particulière, mais il est fréquent qu'ils soient éparpillés dans le site. Parfois ils seront bien identifiables car leur adresse est écrite en clair, mais souvent ils ne sont identifiables que par le fait qu'un mot est écrit soit dans une couleur, soit dans une police différente et changera d'aspect si vous passez la souris dessus. Il faut avoir le réflexe de vérifier. Si un mot est support d'un lien vers une autre page du même site ou un autre site, lorsque vous passez la souris dessus l'adresse du lien s'affiche en bas de votre navigateur. L'avez-vous remarqué?

Mais ces liens ne sont pas toujours mis à jour et pointent parfois vers un site n'existant plus à cette adresse ou vers une page déplacée. C'est malheureusement un problème général. Ainsi, à titre d'exemple, lorsque vous faites une recherche sur un nom de personne, Google va vous lister tous les sites où cette personne apparait, mais vous n'avez aucune garantie que l'information soit pertinente. Si vous faites une requète du type "Michel Hubin" vous allez obtenir 3790 réponses sur le moteur de Hooseek qui pour la plupart vont faire référence, soit directement, soit le plus souvent indirectement, à un site web que j'ai mis en ligne. Vous trouverez ainsi une occurence de mon nom qui vous conduit sur le site d'une école d'ingénieurs française (que je ne citerai pas) à sa page de "références pédagogiques" et effectivement sur l'une des lignes figure un lien pointant sur une page...du site web expérimental que j'ai créé en 1998 à l'insa de Rouen, site hébergé à l'époque par mon propre PC de bureau à l'insa et qui n'existe plus sous cette forme depuis près de 15 ans et s'appelle aujourd'hui Electron mon Amour. Cette page pédagogique de cette école n'a pas été mise à jour et comporte donc une adresse parfaitement inutilisable alors que le site (et le chapitre) auquel elle fait référence existe toujours mais avec un autre hébergeur. Je n'ai pas analysé les 3790 citations de Hooseek, mais seulement quelques centaines et j'ai rencontré ainsi une vingtaine de fois des liens proposés qui n'existent plus depuis longtemps.

Que faire lorsqu'une adresse pointe sur une page qui n'existe plus? Plusieurs cas se présentent : soit le site n'existe plus, soit il existe mais la page recherchée a été supprimée ou déplacée, soit il y a une faute de frappe dans l'adresse (ce qui est aussi fréquent), dans tous les cas l'hébergeur supposé du site vous renverra sur une page d'erreur. Neuf fois sur dix l'internaute lambda en reste là et ne se pose pas de question, alors qu'avec un peu de réflexion dans bien des cas il aurait pu aboutir au site recherché. Ainsi, par exemple, sur un site vous avez trouvé un lien qui vous intéresse a priori, vous cliquez sur le mot support du lien et... ça ne marche pas. Vérifiez alors en premier lieu l'adresse. Supposons que celle-ci soit notée http://hebergeur-monsite.genial/pagge.htm. Il convient alors de tester l'adresse http://hebergeur-monsite.genial ce qui vous permet de savoir si ce site existe bien et, dans le cas favorable, de retrouver à partir de sa page d'accueil celle que vous recherchez et qui ne s'appelle pas pagge.htm mais page.htm. Il y avait une faute de frappe tout simplement. Mon expérience me fait dire que çette démarche réussit plus d'une fois sur deux. Si vous trouvez ce lien sur un site lui-même en ligne depuis longtemps, laissant prévoir que ce lien n'est lui-même pas récent il se peut que ce soit son hébergeur qui a changé. On peut alors essayer de se connecter sur le site en tapant simplement monsite.genial/page.htm dans la fenêtre de navigation de la barre d'état de votre navigateur, quelquefois ça marche, sinon dans la fenêtre spécifique de Google on tente monsite.genial, Google testera alors tous les avatars monsite genial, monsite-genial, mon site.genial et monsite.génial, etc... avant de vous fournir une réponse.

les mots-clés

Pour trouver un site dont on ignore l'adresse et même l'existence on peut utiliser des mots-clés. C'est même le moyen privilégié pour trouver tous les sites se rapportant à une question précise. Il convient de comprendre le mode de fonctionnement des moteurs de recherche afin d'obtenir le moins mauvais résultat possible. Et beaucoup d'internautes ne savent pas comment obtenir ce résultat.

Le créateur d'un site web, c'est à dire la personne qui sait le mieux ce qu'il y a dedans, va en général aider les moteurs de recherche à identifier le contenu du site en plaçant au début de chaque fichier un ensemble d'informations dans ce but. Il y a trois informations principales : le titre de la page web qui peut être le titre du site tout simplement, mais souvent il s'agit d'un titre plus complet. Ainsi le site que vous lisez actuellement s'appelle "Electron mon Amour" et la plupart des fichiers vont reprendre ce titre mais en le complétant on aura ainsi une page qui s'appellera "Electron mon Amour - Ecologie". Ainsi si vous avez spécifié le mot "écologie" le moteur de recherche vous répertoriera tous les sites possédant le mot écologie dans un titre de page et vous fournira, non pas l'adresse de la page d'accueil du site, mais directement celle de cette page "écologie". C'est évidemment un gain de temps pour l'utilisateur qui sera conduit directement sur la page susceptible de l'intéresser, mais en contrepartie il y a fort à parier qu'il ne prendra pas toujours conscience que cette page fait partie d'un ensemble beaucoup plus vaste et pour d'autres sites, conçus différemment de celui-ci, il se peut fort bien que rien ne lui permette de l'imaginer. La page peut effectivement être totalement autonome et n'avoir aucun lien interne permettant de la rattacher au reste du site (tout simplement parce que le concepteur l'a oublié ou n'a pas jugé utile de mettre un lien de retour vers la page d'accueil parce qu'il ne sait pas bien lui-même comment fonctionnent les moteurs de recherche).

Le titre de la page peut être informatif mais ce n'est pas forcément suffisant. Dans notre exemple si vous choisissez le mot-clé "environnement" si le moteur de recherche se contente de chercher ce mot dans le titre de la page, il ne trouvera évidemment pas celle-ci qui s'appelle "écologie" et pourtant tout le contenu de la page à trait à l'environnement. Pour résoudre ce problème on a donc à notre disposition la possibilité d'ajouter après le titre de la page une description du contenu de la page et dans ce cas le webmaster va, par exemple, écrire qu'il s'agit de "l'étude de l'environnement du lac de Constance". Le mot "environnement" figure dans la description et le moteur de recherche l'a enregistré dans sa base de données et il vous proposera donc ce site parmi tous ceux qui répondent à ce mot-clé choisi par l'internaute. Cependant la description est nécessairement limitée à 2 ou 3 lignes (et en outre certains moteurs de recherche n'en mémorisent que les 255 premiers caractères, par exemple) donc on ne peut pas tout dire du contenu de la page dans ce résumé. Les concepteurs du langage HTML ont donc imaginé un troisième procédé complémentaire des deux autres qui consiste à préciser une liste de mots-clés représentatifs du contenu. Ainsi si la page web s'intéresse à l'environnement du lac de Constance mais plus particulièrement dans l'une des iles de ce lac, par exemple l'ile de Mainau, le webmaster aura précisé "Mainau" dans sa liste de mots-clés et si, en outre, il s'agit tout spécialement des papillons de cette ile, il aura mis le mot "papillons" comme second mot-clé. On voit qu'un site bien conçu sera celui dans lequel ces 3 moyens d'identification seront parfaitement complémentaires.

Les grands moteurs de recherche vont encore plus loin dans l'analyse d'un site. Ils ne se contentent pas de mémoriser les titre, description et mots-clés définis par le webmaster, ils analysent tout le contenu de la page et en déduisent les mots les plus fréquemment employés dans celle-ci et donc ceux qu'ils considèreront comme les plus pertinents. C'est à la fois fantastique et souvent inadapté. Ainsi supposons que dans cette page web consacrée à l'écologie de l'ile de Mainau, le webmaster parle des papillons qu'il y a rencontré mais sans jamais utiliser le mot papillon (et sans l'avoir indiqué comme mot-clé) car pour chaque espèce dont il va parler il donnera son nom commun: il citera ainsi le vulcain, la petite tortue, le grand paon du jour,etc... mais n'écrira pas une seule fois le mot papillon dans la page. Le moteur de recherche qui est un robot ignare sera incapable de comprendre que la page est consacrée aux papillons et quand un internaute spécifiera le mot "papillon" comme mot-clé le moteur considérera que cette page n'est pas pertinente en terme de papillons et donc ne la proposera pas à l'internaute.

Imaginons maintenant qu'un autre internaute s'intéresse aux tortues (et non aux papillons) et tape donc le mot clé "tortue", le robot risque fort de lui proposer cette page sur l'ile de Mainau où il n'y a pas trace de la moindre tortue mais où le concepteur de la page a cité le papillon qui s'appelle "petite tortue" et ce mot tortue est donc indexé et possède exactement la même orthographe que celui écrit par notre internaute amateur de tortues. Ce type d'anomalies est extrêmement fréquent. Alors comment pratiquer pour minimiser ce risque. Dans ce cas particulier supposons que notre internaute ait écrit "tortue marine" et non simplement "tortue" le moteur de recherche va alors sélectionner tous les sites où il trouve le mot tortue et le mot marine et les proposer dans un ordre bien précis : d'abord ceux qui ont l'expression "tortue marine", puis ceux qui ont les deux mots séparés mais présents dans la page en les rangeant dans un ordre qui tient compte (attention ce n'est pas le seul critère) de leur éloignement l'un de l'autre, puis viendront les sites qui ne comportent que le mot tortue (et là on retrouvera notre ile de Mainau), puis ceux où le mot marine est seul. Et c'est pourquoi le moteur de recherche vous annonce fièrement qu'il y a 718000 réponses pour tortue marine, mais en fait il n'y en a seulement qu'une cinquantaine qui parlent réellement de tortues marines. Le moteur de recherche classera sans doute aussi dans ses réponses positives les sites où l'on rencontre le mot "tortues" au pluriel qui viendront loin derrière ceux comportant le mot tortue car pour le moteur de recherche il s'agit de deux mots distincts et si vous avez le courage de lire toutes les propositions vous constaterez que le moteur de recherche vous propose aussi des sites dans lesquels on rencontre le mot "tortueux". Les concepteurs de ce moteur de recherche sont-ils réellement débiles? Malheureusement non car ils sont obligés de tenir compte des fautes d'orthographe faites couramment par les internautes (ce que confirme l'étude citée en préambule).

Ainsi sur le site "Electron mon Amour" essentiellement consacré à l'électronique il y a un chapitre sur l'amplificateur opérationnel qui est très lu. Les requètes des internautes conduisant à ce chapitre sont toutes mémorisées par Xiti, l'organisme qui gère mes statistiques, et je regarde de temps en temps ce listing pour savoir quelles sont les pages du site les plus lues et j'ai constaté que cette page particulière est demandée à partir de multiples requètes dont voici une liste (relevée sur une seule journée de janvier 2008) : amplificateur opérationnel, ampli op, ampli opérationnel, ampli operationel, amplificateur oppérationel, amplifficatteur oprationel. Il est vraisemblable qu'en analysant les requètes sur une année je trouverais une dizaine d'autres occurences pour amplificateur opérationnel. Seules les deux premières désinences de cette liste figurent effectivement dans le site, toutes les combinaisons avec fautes d'orthographe multiples supposent que le robot dispose de la capacité de comprendre qu'il s'agit du même mot-clé et dans ce cas les internautes nuls en orthographe ont quand même eu accès à l'information qu'ils recherchaient. Comme vous pouvez le constater le robot a été capable soit de rajouter les lettres manquantes, soit de supprimer celles en excès et, dans le dernier cas, de faire les deux types de correction simultanément.

Il arrive cependant que les concepteurs du logiciel gérant le moteur de recherche aient donné trop de latitude d'interprétation au système et que ça conduise à des erreurs. Ainsi par ex si vous vous intéressez à l'écrivain Simone Arèse et tapez simplement "Arèse" dans la fenêtre de saisie de Google vous allez obtenir 188000 réponses. Dès la première page de réponses vous constatez une anomalie car Google vous propose des sites avec le mot ARESE (sans accent) et ce n'est qu'à la cinquième page que vous verrez apparaitre une réponse avec le mot Arèse correctement orthographié comme dans votre requète et ce n'est qu'à la sixième page que vous trouverez le site web personnel de Simone Arèse et si vous continuez à examiner les propositions de Google vous découvrirez qu'à la huitième page le mot Arèse est devenu "adresse" car le robot suppose que vous avez voulu écrire adresse et que vous avez perdu le d et un s... Ce genre de gag est extrêmement désagréable. Et dites vous bien que pour toutes les recherches que vous faites sur internet vous êtes susceptibles de tomber sur ce type de problème.

Alors que faire? Un premier procédé consiste à utiliser un mot-clé composé par exemple "tortue marine" et non simplement "tortue" et à préciser au moteur de recherche que vous ne vous intéressez qu'au web francophone et que vous recherchez les sites où figure l'expression exacte "tortue marine" et dans ce cas au lieu de 718000 réponses vous n'en aurez plus que 3270. Si maintenant vous précisez "tortue marine de" Google ne vous proposera plus que 377 documents et enfin si vous demandez "tortue marine de méditerranée" vous n'aurez plus que 2 réponses distinctes. Pour réaliser cette recherche affinée on va donc ouvrir sous Google la page "recherche avancée" en cliquant sur ces mots en haut de la première page de propositions de Google. Puis on précisera l'expression exacte dans la case correspondante de la page, on pourra éventuellement restreindre la recherche à une région précise ou une langue précise. Notons enfin que si l'expression est trop précise on risque de ne plus avoir de réponse du tout ainsi en précisant "tortue de méditerranée" on obtiendra à nouveau 2 réponses d'ailleurs différentes de celles obtenues dans le cas précédent. On va donc tester une autre expression ayant le même sens "tortue méditerranéenne" et on se retrouve alors devant 68 propositions ce qui parait plus réaliste.

La conclusion est donc qu'il faut effectuer plusieurs essais afin de cibler au mieux ce que l'on cherche et ensuite il ne faut pas se limiter à l'analyse de la seule première page de réponses. On va expliquer pourquoi dans le paragraphe suivant.

le ranking

Ce mot à consonnance anglophone pourrait se traduire en français par "rang" tout simplement ou "classement", mais les "zinformaticiens" sont incapables de s'exprimer comme Littré!

En effet si l'on reprend l'exemple des tortues méditerranéennes, il y a 68 réponses. Comment sont elles classées? Pourquoi le robot les range-t-il dans cet ordre? Est-ce pertinent? En fait chaque moteur de recherche utilise un algorithme différent pour effectuer ce classement. Ainsi avec la même base de données Google ou Yahoo ne fourniront pas le même classement, en outre ils n'ont pas exactement la même base de données. On a vu que le moteur de recherche va placer dans le peloton de tête les sites dans lesquels il va trouver les mots demandés dans l'ordre et seulement ceux-là si l'on a précisé qu'on voulait l'expression exacte. Le deuxième critère que va utiliser Google c'est la notoriété du site (selon les critères de Google!) ainsi un site qui a beaucoup de visiteurs va se retrouver en tête du classement et apparaissant sur la première page des réponses il va être vraisemblablement consulté par l'internaute auquel Google le propose en première page, consultation qui se traduit par un clic que Google va enregistrer et utiliser pour confirmer la notoriété de ce site, le site va donc continuer à être en tête en confortant sa pole position tandis qu'un site nouveau venu sera initialement classé en fin de liste et va donc avoir beaucoup de mal à améliorer sa position et apparaitre dans les premières pages du classement. C'est pourquoi lorsque vous recherchez un site dont vous savez qu'il existe mais dont vous ne connaissez pas l'adresse exacte il ne faut pas hésiter à visionner toutes les réponses jusqu'à ce que vous le trouviez, ou à tester plusieurs expressions ou plusieurs mots-clés différents car avec un mot-clé différent il peut être mieux classé.

Ainsi, par exemple, si vous cherchez le site personnel de Simone Arèse (écrire c'est vivre multiple) et que vous tapez simplement le mot Arèse ce site n'apparait qu'en cinquième page, si par contre vous tapez Simone Arèse vous le voyez dès la première page en troisième position et enfin si vous tapez Arèse Simone il n'apparaitra alors que sur la deuxième page en 14ème position. Cela signifie que les internautes qui recherchent ce site ont préférentiellement utilisé l'expression Simone Arèse plutôt que les deux autres. Et si vous allez encore plus loin et spécifiez Arèse Simone comme expression exacte vous constaterez alors que le site de Simone Arèse ne figure pas dans les 50 propositions de Google. Pourquoi? Tout simplement parce que dans le site personnel de Simone Arèse ne figure que la succession Simone Arèse et non pas Arèse Simone.

les liens sponsorisés

De plus en plus de moteurs de recherche mettent en place ce qu'ils appellent des liens sponsorisés, c'est à dire qu'ils placent systématiquement en tête de liste des liens vers des sites censés répondre à votre requète mais qui ont payé pour être placés là. L'expérience montre que ces sites ne répondent en général que très imparfaitement à votre requète et ne mériteraient pas d'être cités dans la première page, mais leurs propiéraires sont en général des entreprises qui en finançant leur placement font vivre les moteurs de recherche (et les millions de dollars de bénéfices de Google en sont la preuve). Là encore une étude récente menée auprès des utilisateurs a montré que plus de la moitié ne se sont pas rendu compte de l'existence de deux catégories de sites dans la réponse de Google et n'ont pas compris que ces liens sponsorisés ne répondent pas à leur requète mais sont une forme de marketing. Et pourtant ces liens commerciaux sont signalés comme tels par Google et placés sur un fond de couleur.

Il convient pourtant de laisser de côté ces liens commerciaux le plus souvent et de regarder avec attention les liens suivants correspondant réellement à votre requète et qui peuvent donc être repoussés sur la seconde voire parfois la troisième page et il se peut alors que celui qui vous fournira la meilleure information compte tenu de tous les avatars du classement soit en quatrième page. Donc pensez-y toujours : il ne faut pas se contenter des deux premières pages de résultat.

La conclusion c'est donc qu'il faut bien réfléchir aux mots-clés qu'on va utiliser pour tenter de trouver un site web pertinent et simultanément je conseillerai aux webmasters de bien réfléchir à l'exemple que je viens de traiter pour définir de manière optimale les mots-clés qu'ils vont afficher en tête de leurs pages.

avertissement	pourquoi cette page
les moteurs de recherche	les principaux
les annuaires	spécialisés ou non
les liens
les mots-clés	et leur interprétation
le ranking	la grande inconnue

		une collection d'icônes pour visiter tout le site

	© 2000-2015 LHERBAUDIERE 4 pages à l'impression		dernière mise à jour 27 janvier 2015