C'est quoi un moteur de recherche ?
Par Vaisonet - Veille ecommerce le mercredi 23 mai 2007, 10:46 - Référencement - Lien permanent
Avant de rentrer dans des considérations sur "comment marche Google (et autres)", il faut bien comprendre qu'un moteur de recherche est similaire à une paire de jumelles. Quand vous regardez le monde au travers, vous n'en voyez qu'un morceau, grossi et déformé. Dès que vous les retirez, vous recommencez à voir le monde dans son intégralité. Un moteur de recherche agit de la même manière en ce qu'il ne voit qu'une toute petite partie du web.
En outre, dans sa manière de vous présenter les résultats, il donne un sens au résultat, à cause de la manière dont il le présente. Si on prend Google, les sites résultants d'une recherche sont classés par "page rank", c'est-à-dire grossièrement que plus un site est référencé, plus il est considéré comme pertinent (nous reviendrons dans un prochain article là-dessus). Cependant, il arrive fréquemment que le site qui ait la réponse que vous recherchez ne soit pas le premier de la liste. On peut apparenter cela à un dictionnaire qui serait trié par fréquence d'utilisation d'un mot dans une langue.
Cela vient aussi de la manière de poser la question. Les moteurs de recherche ne sont pas encore doués de capacités syntaxiques et sémantiques très évoluées : on ne peut pas leur parler comme on le ferait à n'importe qui. En fait, le langage qu'on emploi pour leur poser des questions est encore plus rustique que celui d'un enfant de 2 ans. Donc, forcément, quand on pose mal la question, ce n'est pas simple de trouver la bonne réponse.
Donc pour résumer ce qu'est un moteur de recherche :
* une paire de jumelle car il ne donne accès qu'à une minuscule partie d'Internet ; * un dictionnaire étrangement trié ; * un enfant de 2 ans aux capacités d'expression plus que limitées.
Pour remédier en partie à ces lacunes, les moteurs de recherche fournissent une pléthore plus ou moins importante de mots-clés permettant d'affiner les recherche.
Plus vous comprendrez le fonctionnement interne de Google et plus vous serez en mesure de découvrir l'information au fin fond du web. Mais avant de plonger directement dans les abîmes de la quintessence de son utilisation, un petit rafraîchissement des mémoires quant à son utilisation de base s'impose.
Avant de parler de mots-clés il est intéressant de comprendre certains principes de base. La plus simple requête dans Google que vous pouvez effectuer sera une suite de mots :
bétancourt libération
De cette manière Google recherche les pages contenant les mots "bétancourt" et "libération". Ce qui est intéressant de savoir c'est que Google cherche ces deux mots mais pas nécessairement l'un à la suite de l'autre. Pour que Google cherche ces deux mots l'un à la suite de l'autre il faudra utiliser des guillemets:
"bétancourt libération"
Une variante est d'utiliser l'astérisque. Contrairement à certaines idées préconçues, l'astérisque ne remplace pas une lettre mais un mot.
"Bétancourt * libération"
Cette requête trouvera des pages contenant "Bétancourt prochaine libération" et de nombreuses autres.
Quelques autres règles importantes à mémoriser : Google ne fait pas la différence entre majuscule et minuscule, il ne considère pas les accents, il est limité à une recherche de 10 mots mais surtout il y a un poids attribué à chaque mot. Par exemple, une requête comme :
bétancourt libération FARC guérilla
n'aura pas le même résultat qu'un requête comme :
bétancourt libération FARC guérilla guérilla guérilla
Plus un mot apparaît dans la requête, plus il est considéré comme important.
Dans la catégorie "je veux exclure un mot", il est possible d'utiliser l'opérateur '-' :
bétancourt libération FARC -uribe
De cette manière, Google retourne toute les pages comprenant ces trois derniers mots mais sans le mot 'clearstream'. L'opérateur "-" est de notre point de vue un des opérateurs les plus intéressant pour affiner une recherche.
Il s'agit là pour l'essentiel de ce qu'on appelle des "opérateurs booléen" : et (AND), ou (OR) et non (NOT). Ils permettent de construire les phrases pour l'enfant de 2 ans. Implicitement le "et" sert à relié tous les mots. Si on cherche l'un ou l'autre, on utilise alors le OR :
bétancourt OR libération
Mais si on préfère l'un sans l'autre :
bétancourt -libération
Et voilà, c'est fini pour l'instant ... mais la suite arrive : les mots clés.
Par Fred Raynal sur Googleinside
