avertissement
Nombre d'internautes ignorants du fonctionnement d'internet l'utilisent mal
et ne savent pas trouver ce qu'ils cherchent. Le but de ce chapitre est donc
d'expliquer tous les pièges et les principes qui sont à la base
des annuaires et moteurs de recherche afin de pouvoir les utiliser efficacement.
En effet une étude intéressante a été publiée
sur le Web (en mai 2008) au sujet des moteurs de recherche, proposée
par ASBL Edudoc et le Conseil inter-universitaire francophone (CIUF) qui ont
demandé à 1 865 jeunes utilisateurs du Web d'effectuer des recherche
documentaires et informationnelles. Note moyenne reçue par nos documentalistes
en herbe : 7,67 sur 20 !
Et le fait d'avoir une connexion Internet à domicile n'aide en rien les
étudiants à être plus performants dans leurs investigations,
bien au contraire. Un travail similaire sur les seuls étudiants canadiens
avait, il y a quelques temps, révélé une moyenne de 8,97.
Pas top non plus...
Identification, vérification et choix des sources, recherche de supports
additionnels (bibliothèques, bases de données documentaires),
syntaxe d'interrogation, tous ces concepts semblent totalement occultés,
à tel point que certains indiquent même préférer
la télévision aux livres pour trouver leurs informations. On
croit rêver... Bref, un sujet de réflexion intéressant
et important, voire capital, pour l'avenir de nos chères têtes
blondes et une vraie nécessité d'enseigner les bases de la recherche
et du traitement d'information sur le Web...
les moteurs de recherche
Le principal outil pour
trouver une information sur internet c'est le moteur de recherche. Au début
de 2008 il en existe sans doute plus d'un millier à votre disposition,
mais en pratique vous n'en utiliserez qu'un seul la plupart du temps. Quels
sont- ils?
Il en existe en fait 3 catégories : les moteurs généralistes,
les moteurs spécialisés, et les moteurs internes à un site
web.
Parmi les généralistes on peut citer Google, Yahoo, Bing et Baidu
(en Chine) .
Les moteurs spécialisés sont nombreux mais connus des seuls spécialistes
du domaine et sont plutôt des annuaires que de véritables moteurs
de recherche car ils n'ont en général indexé que les adresses
et les noms de site et parfois aussi les descriptions et mots-clés figurant
en tête du code source de la page d'accueil du site, mais pas le contenu
réel du site.
Le moteur typique intégré à un site et permettant des recherches
sur ce seul site c'est évidemment celui de Wikipédia, l'encyclopédie
en ligne. En outre nombre de sites placent à l'intérieur de leur
site la barre de recherche de Google qui fait évidemment double emploi
avec celle qui est déjà intégrée à votre
navigateur (dans la plupart des cas aujourd'hui) et ne vous apportera rien de
plus puisque c'est la même.
L'une des différences
essentielles qui est évidemment liée à la puissance de
l'organisation qui se cache derrière le sigle, c'est leur rapidité
de mise à jour. Quand vous proposez un nouveau site à Google,
deux jours plus tard il a été indexé et on peut le retrouver
grâce à Google. Pour d'autres moteurs il faut attendre jusqu'à
3 mois pour voir apparaître un nouveau site dans leur liste. Et bien évidemment
si le site subit un lifting il leur faudra à nouveau plus de 3 mois pour
le prendre en compte, alors que Google ne mettra jamais plus de 2 ou 3 jours
pour prendre en compte vos mises à jour.
Nous prendrons dans la suite l'exemple de Google qui représente en France
(et ailleurs) environ 85% des requètes sur internet.
Les annuaires
Divers sites proposent des annuaires classés par spécialités
ou par thème. Selon leur importance et leur notoriété les
listes de sites par thématique seront plus ou moins longues à
balayer. En effet dans un annuaire, c'est comme dans l'annuaire papier de France
Télécom les sites sont classés les uns derrière
les autres et c'est à vous de balayer l'annuaire jusqu'à trouver
ce qui est susceptible de vous intéresser. Pour chaque site l'annuaire
vous fournit son adresse et une très courte description le plus souvent
les n premiers caractères de la description fournie par le webmaster
du site ce qui n'est généralement pas très informatif.
Chaque hébergeur dispose d'un annuaire des sites qu'il héberge
et de plus en plus il élargit cet annuaire en dehors de son champ propre
d'activité.
Certains organismes associés à des compteurs sur les sites inscrits
proposent des classements, eux aussi organisés par thématique,
en fonction de la fréquentation des sites ce qui permet lorsqu'on cherche
un site quelconque dans un domaine précis de sélectionner rapidement
ceux qui sont les plus vus et donc vraisemblablement les plus intéressants.
Malheureusement ces classements sont biaisés car, d'une part, ils ne
concernent que les sites inscrits dans ledit classement et, d'autre part, c'est
le webmaster du site qui choisit dans quelle catégorie il va inscrire
son site et ainsi divers sites commerciaux peu scrupuleux sont souvent inscrits
dans des rubriques parfaitement inappropriées mais plus "porteuses"
et encombrent le classement. On trouve ainsi parfois dans une rubrique "art"
des sites consacrés à l'astrologie et dans une rubrique "éducation"
j'ai rencontré pas moins de 36 sites consacrés aux prénoms!
Le mode de classement varie évidemment selon l'organisme gérant
celui-ci et un site inscrit dans plusieurs classements peut ainsi être
dans les tous premiers dans un classement et en milieu de tableau dans un autre
selon que ce classement va tenir compte du nombre de connexions, mais aussi
du nombre de pages vues et du temps passé par les internautes sur ce
site et bien sûr selon qu'il enregistrera ou non toutes les connexions.
En effet pour qu'une connexion soit enregistrée par un organisme
quelconque il faut qu'une information soit envoyée par le site
vers cet organisme et en raison de l'encombrement croissant des lignes téléphoniques
il arrive de plus en plus souvent que l'internaute passe à une autre
page ou un autre site avant que cette information de comptage ne soit parvenue
à l'organisme gérant le compteur ce qui va évidemment fausser
le classement. Il en résulte que si l'on se limite à un seul annuaire
de ce type on risque de passer à côté d'un site qui serait
pourtant intéressant.
Pour illustrer ceci je prendrai l'exemple d'Electron mon Amour qui
a été inscrit dans 3 classements différents à une
certaine époque (afin justement de mettre en évidence les divergences
de ces classements) et qui dans la rubrique "éducation" était
un même jour classé 7ème chez Weborama, 36ème
au Hit-Parade et 63ème dans le classement d'Hebdotop dans la même
rubrique. Au début de 2008 Electron mon Amour dispose de plusieurs
types de compteurs : celui de l'hébergeur Orange qui est le
seul à enregistrer obligatoirement (par construction) toutes les
connexions, celui de Xiti qui en enregistre en moyenne plus de 95%,
celui de cluster maps testé depuis peu et qui n'en identifie
au mieux que 15% et certains jours beaucoup moins, les compteurs de freecompteur.com
qui n'enregistrent pas tout non plus mais seulement environ 60% (par rapport
à Orange), cette divergence implique donc que la plupart des classements
des annuaires ne sont pas exactement représentatifs de la notoriété
d'un site mais vont simplement donner une idée de sa notoriété.
les liens dans un site
De nombreux sites web comportent divers liens, plus ou moins classés,
vers des sites ayant soit la même thématique, soit liés
par une relation amicale entre webmasters. Il n'est que trop rarement aisé
de deviner s'ils vont concerner le problème qui vous intéresse,
sauf si le webmaster ne se contente pas de mettre un simple logo mais fournit
un commentaire précisant la nature du site.
Ces liens peuvent être classés
dans une page particulière, mais il est fréquent qu'ils soient
éparpillés dans le site. Parfois ils seront bien identifiables
car leur adresse est écrite en clair, mais souvent ils ne sont identifiables
que par le fait qu'un mot est écrit soit dans une couleur, soit dans
une police différente et changera d'aspect si vous passez la souris
dessus. Il faut avoir le réflexe de vérifier. Si un mot est
support d'un lien vers une autre page du même site ou un autre site,
lorsque vous passez la souris dessus l'adresse du lien s'affiche en bas de
votre navigateur. L'avez-vous remarqué?
Mais ces liens ne sont pas toujours mis à jour et pointent parfois vers
un site n'existant plus à cette adresse ou vers une page déplacée.
C'est malheureusement un problème général. Ainsi, à
titre d'exemple, lorsque vous faites une recherche sur un nom de personne, Google
va vous lister tous les sites où cette personne apparait, mais vous n'avez
aucune garantie que l'information soit pertinente. Si vous faites une requète
du type "Michel Hubin" vous allez obtenir 3790 réponses sur
le moteur de Hooseek qui pour la plupart vont faire référence,
soit directement, soit le plus souvent indirectement, à un site web que
j'ai mis en ligne. Vous trouverez ainsi une occurence de mon nom qui vous conduit
sur le site d'une école d'ingénieurs française (que je
ne citerai pas) à sa page de "références pédagogiques"
et effectivement sur l'une des lignes figure un lien pointant sur une page...du
site web expérimental que j'ai créé en 1998 à l'insa
de Rouen, site hébergé à l'époque par mon propre
PC de bureau à l'insa et qui n'existe plus sous cette forme depuis près
de 15 ans et s'appelle aujourd'hui Electron mon Amour. Cette page pédagogique
de cette école n'a pas été mise à jour et comporte
donc une adresse parfaitement inutilisable alors que le site (et le chapitre)
auquel elle fait référence existe toujours mais avec un autre
hébergeur. Je n'ai pas analysé les 3790 citations de Hooseek,
mais seulement quelques centaines et j'ai rencontré ainsi une vingtaine
de fois des liens proposés qui n'existent plus depuis longtemps.
Que faire lorsqu'une adresse pointe sur une page qui n'existe plus? Plusieurs
cas se présentent : soit le site n'existe plus, soit il existe mais la
page recherchée a été supprimée ou déplacée,
soit il y a une faute de frappe dans l'adresse (ce qui est aussi fréquent),
dans tous les cas l'hébergeur supposé du site vous renverra sur
une page d'erreur. Neuf fois sur dix l'internaute lambda en reste là
et ne se pose pas de question, alors qu'avec un peu de réflexion dans
bien des cas il aurait pu aboutir au site recherché. Ainsi, par exemple,
sur un site vous avez trouvé un lien qui vous intéresse a
priori, vous cliquez sur le mot support du lien et... ça ne marche
pas. Vérifiez alors en premier lieu l'adresse. Supposons que celle-ci
soit notée http://hebergeur-monsite.genial/pagge.htm. Il convient alors
de tester l'adresse http://hebergeur-monsite.genial ce qui vous permet de savoir
si ce site existe bien et, dans le cas favorable, de retrouver à partir
de sa page d'accueil celle que vous recherchez et qui ne s'appelle pas pagge.htm
mais page.htm. Il y avait une faute de frappe tout simplement. Mon expérience
me fait dire que çette démarche réussit plus d'une fois
sur deux. Si vous trouvez ce lien sur un site lui-même en ligne depuis
longtemps, laissant prévoir que ce lien n'est lui-même pas récent
il se peut que ce soit son hébergeur qui a changé. On peut alors
essayer de se connecter sur le site en tapant simplement monsite.genial/page.htm
dans la fenêtre de navigation de la barre d'état de votre navigateur,
quelquefois ça marche, sinon dans la fenêtre spécifique
de Google on tente monsite.genial, Google testera alors tous les avatars
monsite genial, monsite-genial,
mon site.genial et monsite.génial,
etc... avant de vous fournir une réponse.
les mots-clés
Pour trouver un site dont
on ignore l'adresse et même l'existence on peut utiliser des mots-clés.
C'est même le moyen privilégié pour trouver tous les sites
se rapportant à une question précise. Il convient de comprendre
le mode de fonctionnement des moteurs de recherche afin d'obtenir le moins
mauvais résultat possible. Et beaucoup d'internautes ne savent pas
comment obtenir ce résultat.
Le créateur d'un site web, c'est à dire la personne qui sait le
mieux ce qu'il y a dedans, va en général aider les moteurs de
recherche à identifier le contenu du site en plaçant au début
de chaque fichier un ensemble d'informations dans ce but. Il y a trois informations
principales : le titre de la page web qui peut être le titre du site tout
simplement, mais souvent il s'agit d'un titre plus complet. Ainsi le site que
vous lisez actuellement s'appelle "Electron mon Amour" et la plupart
des fichiers vont reprendre ce titre mais en le complétant on aura ainsi
une page qui s'appellera "Electron mon Amour - Ecologie". Ainsi si
vous avez spécifié le mot "écologie" le moteur
de recherche vous répertoriera tous les sites possédant le mot
écologie dans un titre de page et vous fournira, non pas l'adresse de
la page d'accueil du site, mais directement celle de cette page "écologie".
C'est évidemment un gain de temps pour l'utilisateur qui sera conduit
directement sur la page susceptible de l'intéresser, mais en contrepartie
il y a fort à parier qu'il ne prendra pas toujours conscience que cette
page fait partie d'un ensemble beaucoup plus vaste et pour d'autres sites, conçus
différemment de celui-ci, il se peut fort bien que rien ne lui permette
de l'imaginer. La page peut effectivement être totalement autonome et
n'avoir aucun lien interne permettant de la rattacher au reste du site (tout
simplement parce que le concepteur l'a oublié ou n'a pas jugé
utile de mettre un lien de retour vers la page d'accueil parce qu'il ne sait
pas bien lui-même comment fonctionnent les moteurs de recherche).
Le titre de la page peut
être informatif mais ce n'est pas forcément suffisant. Dans notre
exemple si vous choisissez le mot-clé "environnement" si le
moteur de recherche se contente de chercher ce mot dans le titre de la page,
il ne trouvera évidemment pas celle-ci qui s'appelle "écologie"
et pourtant tout le contenu de la page à trait à l'environnement.
Pour résoudre ce problème on a donc à notre disposition
la possibilité d'ajouter après le titre de la page une
description du contenu de la page et dans ce cas le webmaster va, par
exemple, écrire qu'il s'agit de "l'étude de l'environnement
du lac de Constance". Le mot "environnement" figure dans la description
et le moteur de recherche l'a enregistré dans sa base de données
et il vous proposera donc ce site parmi tous ceux qui répondent à
ce mot-clé choisi par l'internaute. Cependant la description est nécessairement
limitée à 2 ou 3 lignes (et en outre certains moteurs de recherche
n'en mémorisent que les 255 premiers caractères, par exemple)
donc on ne peut pas tout dire du contenu de la page dans ce résumé.
Les concepteurs du langage HTML ont donc imaginé un troisième
procédé complémentaire des deux autres qui consiste à
préciser une liste de mots-clés représentatifs du contenu.
Ainsi si la page web s'intéresse à l'environnement du lac de Constance
mais plus particulièrement dans l'une des iles de ce lac, par exemple
l'ile de Mainau, le webmaster aura précisé "Mainau"
dans sa liste de mots-clés et si, en outre, il s'agit tout spécialement
des papillons de cette ile, il aura mis le mot "papillons" comme second
mot-clé. On voit qu'un site bien conçu sera celui dans lequel
ces 3 moyens d'identification seront parfaitement complémentaires.
Les grands moteurs de recherche
vont encore plus loin dans l'analyse d'un site. Ils ne se contentent pas de
mémoriser les titre, description et mots-clés définis par
le webmaster, ils analysent tout le contenu de la page et en déduisent
les mots les plus fréquemment employés dans celle-ci et donc ceux
qu'ils considèreront comme les plus pertinents. C'est à la fois
fantastique et souvent inadapté. Ainsi supposons que dans cette page
web consacrée à l'écologie de l'ile de Mainau, le webmaster
parle des papillons qu'il y a rencontré mais sans jamais utiliser le
mot papillon (et sans l'avoir indiqué comme mot-clé) car pour
chaque espèce dont il va parler il donnera son nom commun: il citera
ainsi le vulcain, la petite tortue, le grand paon du jour,etc... mais n'écrira
pas une seule fois le mot papillon dans la page. Le moteur de recherche qui
est un robot ignare sera incapable de comprendre que la page est consacrée
aux papillons et quand un internaute spécifiera le mot "papillon"
comme mot-clé le moteur considérera que cette page n'est pas pertinente
en terme de papillons et donc ne la proposera pas à l'internaute.
Imaginons maintenant qu'un autre internaute s'intéresse aux tortues (et
non aux papillons) et tape donc le mot clé "tortue", le robot
risque fort de lui proposer cette page sur l'ile de Mainau où il n'y
a pas trace de la moindre tortue mais où le concepteur de la page a cité
le papillon qui s'appelle "petite tortue" et ce mot tortue
est donc indexé et possède exactement la même orthographe
que celui écrit par notre internaute amateur de tortues. Ce type d'anomalies
est extrêmement fréquent. Alors comment pratiquer pour minimiser
ce risque. Dans ce cas particulier supposons que notre internaute ait écrit
"tortue marine" et non simplement "tortue" le moteur de
recherche va alors sélectionner tous les sites où il trouve le
mot tortue et le mot marine et les proposer dans un ordre bien précis
: d'abord ceux qui ont l'expression "tortue marine", puis ceux qui
ont les deux mots séparés mais présents dans la page en
les rangeant dans un ordre qui tient compte (attention ce n'est pas le seul
critère) de leur éloignement l'un de l'autre, puis viendront les
sites qui ne comportent que le mot tortue (et là on retrouvera notre
ile de Mainau), puis ceux où le mot marine est seul. Et c'est pourquoi
le moteur de recherche vous annonce fièrement qu'il y a 718000 réponses
pour tortue marine, mais en fait il n'y en a seulement qu'une cinquantaine qui
parlent réellement de tortues marines. Le moteur de recherche classera
sans doute aussi dans ses réponses positives les sites où l'on
rencontre le mot "tortues" au pluriel qui viendront loin derrière
ceux comportant le mot tortue car pour le moteur de recherche il s'agit de deux
mots distincts et si vous avez le courage de lire toutes les propositions vous
constaterez que le moteur de recherche vous propose aussi des sites dans lesquels
on rencontre le mot "tortueux". Les concepteurs de ce moteur de recherche
sont-ils réellement débiles? Malheureusement non car ils sont
obligés de tenir compte des fautes d'orthographe faites couramment
par les internautes (ce que confirme l'étude citée en préambule).
Ainsi sur le site "Electron mon Amour" essentiellement consacré
à l'électronique il y a un chapitre sur l'amplificateur
opérationnel qui est très lu. Les requètes
des internautes conduisant à ce chapitre sont toutes mémorisées
par Xiti, l'organisme qui gère mes statistiques, et je regarde de temps
en temps ce listing pour savoir quelles sont les pages du site les plus lues
et j'ai constaté que cette page particulière est demandée
à partir de multiples requètes dont voici une liste (relevée
sur une seule journée de janvier 2008) : amplificateur opérationnel,
ampli op, ampli opérationnel, ampli operationel, amplificateur oppérationel,
amplifficatteur oprationel. Il est vraisemblable qu'en analysant les requètes
sur une année je trouverais une dizaine d'autres occurences pour amplificateur
opérationnel. Seules les deux premières désinences de cette
liste figurent effectivement dans le site, toutes les combinaisons avec fautes
d'orthographe multiples supposent que le robot dispose de la capacité
de comprendre qu'il s'agit du même mot-clé et dans ce cas les internautes
nuls en orthographe ont quand même eu accès à l'information
qu'ils recherchaient. Comme vous pouvez le constater le robot a été
capable soit de rajouter les lettres manquantes, soit de supprimer celles en
excès et, dans le dernier cas, de faire les deux types de correction
simultanément.
Il arrive cependant que
les concepteurs du logiciel gérant le moteur de recherche aient donné
trop de latitude d'interprétation au système et que ça
conduise à des erreurs. Ainsi par ex si vous vous intéressez à
l'écrivain Simone Arèse et tapez simplement "Arèse"
dans la fenêtre de saisie de Google vous allez obtenir 188000 réponses.
Dès la première page de réponses vous constatez une anomalie
car Google vous propose des sites avec le mot ARESE (sans accent) et ce n'est
qu'à la cinquième page que vous verrez apparaitre une réponse
avec le mot Arèse correctement orthographié comme dans votre requète
et ce n'est qu'à la sixième page que vous trouverez le site web
personnel de Simone Arèse et si vous continuez à examiner les
propositions de Google vous découvrirez qu'à la huitième
page le mot Arèse est devenu "adresse" car le robot suppose
que vous avez voulu écrire adresse et que vous avez perdu le d et un
s... Ce genre de gag est extrêmement désagréable. Et dites
vous bien que pour toutes les recherches que vous faites sur internet vous êtes
susceptibles de tomber sur ce type de problème.
Alors que faire? Un premier procédé consiste à utiliser
un mot-clé composé par exemple "tortue marine"
et non simplement "tortue" et à préciser au moteur de
recherche que vous ne vous intéressez qu'au web francophone et que vous
recherchez les sites où figure l'expression exacte "tortue
marine" et dans ce cas au lieu de 718000 réponses vous n'en aurez
plus que 3270. Si maintenant vous précisez "tortue marine de"
Google ne vous proposera plus que 377 documents et enfin si vous demandez "tortue
marine de méditerranée" vous n'aurez plus que 2 réponses
distinctes. Pour réaliser cette recherche affinée on va donc ouvrir
sous Google la page "recherche avancée" en cliquant sur ces
mots en haut de la première page de propositions de Google. Puis on précisera
l'expression exacte dans la case correspondante de la page, on pourra éventuellement
restreindre la recherche à une région précise ou une langue
précise. Notons enfin que si l'expression est trop précise on
risque de ne plus avoir de réponse du tout ainsi en précisant
"tortue de méditerranée" on obtiendra à nouveau
2 réponses d'ailleurs différentes de celles obtenues dans le cas
précédent. On va donc tester une autre expression ayant le même
sens "tortue méditerranéenne" et on se retrouve alors
devant 68 propositions ce qui parait plus réaliste.
La conclusion est donc
qu'il faut effectuer plusieurs essais afin de cibler au mieux ce que
l'on cherche et ensuite il
ne faut pas se limiter à l'analyse de la seule première page de
réponses. On va expliquer pourquoi dans le paragraphe
suivant.
le ranking
Ce mot à consonnance anglophone pourrait se traduire en français
par "rang" tout simplement ou "classement", mais les "zinformaticiens"
sont incapables de s'exprimer comme Littré!
En effet si l'on reprend l'exemple des tortues méditerranéennes,
il y a 68 réponses. Comment sont elles classées? Pourquoi le
robot les range-t-il dans cet ordre? Est-ce pertinent? En fait chaque moteur
de recherche utilise un algorithme différent pour effectuer ce classement.
Ainsi avec la même base de données Google ou Yahoo ne fourniront
pas le même classement, en outre ils n'ont pas exactement la même
base de données. On a vu que le moteur de recherche va placer dans
le peloton de tête les sites dans lesquels il va trouver les mots demandés
dans l'ordre et seulement ceux-là si l'on a précisé qu'on
voulait l'expression exacte. Le deuxième critère que va utiliser
Google c'est la notoriété du site (selon les critères
de Google!) ainsi un site qui a beaucoup de visiteurs va se retrouver en tête
du classement et apparaissant sur la première page des réponses
il va être vraisemblablement consulté par l'internaute auquel
Google le propose en première page, consultation qui se traduit par
un clic que Google va enregistrer et utiliser pour confirmer la notoriété
de ce site, le site va donc continuer à être en tête en
confortant sa pole position tandis qu'un site nouveau venu sera initialement
classé en fin de liste et va donc avoir beaucoup de mal à améliorer
sa position et apparaitre dans les premières pages du classement. C'est
pourquoi lorsque vous recherchez un site dont vous savez qu'il existe mais
dont vous ne connaissez pas l'adresse exacte il ne faut pas hésiter
à visionner toutes les réponses jusqu'à ce que vous le
trouviez, ou à tester plusieurs expressions ou plusieurs mots-clés
différents car avec un mot-clé différent il peut être
mieux classé.
Ainsi, par exemple, si vous cherchez le site personnel de Simone Arèse
(écrire c'est vivre multiple) et que vous tapez simplement le mot Arèse
ce site n'apparait qu'en cinquième page, si par contre vous tapez Simone
Arèse vous le voyez dès la première page en troisième
position et enfin si vous tapez Arèse Simone il n'apparaitra
alors que sur la deuxième page en 14ème position. Cela signifie
que les internautes qui recherchent ce site ont préférentiellement
utilisé l'expression Simone Arèse plutôt que les deux
autres. Et si vous allez encore plus loin et spécifiez Arèse
Simone comme expression exacte vous constaterez alors que le site de
Simone Arèse ne figure pas dans les 50 propositions de Google. Pourquoi?
Tout simplement parce que dans le site personnel de Simone Arèse ne
figure que la succession Simone Arèse et non pas
Arèse Simone.
les liens sponsorisés
De plus en plus de moteurs de recherche mettent en place ce qu'ils appellent
des liens sponsorisés, c'est à dire qu'ils placent systématiquement
en tête de liste des liens vers des sites censés répondre
à votre requète mais qui ont payé pour être placés
là. L'expérience montre que ces sites ne répondent en
général que très imparfaitement à votre requète
et ne mériteraient pas d'être cités dans la première
page, mais leurs propiéraires sont en général des entreprises
qui en finançant leur placement font vivre les moteurs de recherche
(et les millions de dollars de bénéfices de Google en sont la
preuve). Là encore une étude récente menée auprès
des utilisateurs a montré que plus de la moitié ne se sont pas
rendu compte de l'existence de deux catégories de sites dans la réponse
de Google et n'ont pas compris que ces liens sponsorisés ne répondent
pas à leur requète mais sont une forme de marketing. Et pourtant
ces liens commerciaux sont signalés comme tels par Google et placés
sur un fond de couleur.
Il convient pourtant de laisser de côté ces liens commerciaux
le plus souvent et de regarder avec attention les liens suivants correspondant
réellement à votre requète et qui peuvent donc être
repoussés sur la seconde voire parfois la troisième page et
il se peut alors que celui qui vous fournira la meilleure information compte
tenu de tous les avatars du classement soit en quatrième page. Donc
pensez-y toujours : il ne faut pas se contenter des deux premières
pages de résultat.
La conclusion c'est donc
qu'il faut bien réfléchir aux mots-clés qu'on va utiliser
pour tenter de trouver un site web pertinent et simultanément je conseillerai
aux webmasters de bien réfléchir à l'exemple que je viens
de traiter pour définir de manière optimale les mots-clés
qu'ils vont afficher en tête de leurs pages.