|

Au fait,
ça marche comment un moteur de recherche ?
On les utilise souvent, on est impressionné par leurs capacités
sans savoir comment ils fonctionnent. Un moteur de recherche a pour
premier travail d'indexer le plus grand nombre de pages web. En
clair, Voila, Excite, Google, Altavista et les autres récupérent sur la
toile, des millions de pages. Pour cela, les moteurs utilisent des robots
appelés des "spider" qui aspirent ces pages web sur ses
ordinateurs. Ainsi, lorsque vous faites une requête, le moteur va
"fouiller" dans sa base, les pages qui correspondent aux mots-clés
que vous avez entrés. Il ne trouvera donc que des pages qu'il a au préalable
aspirées. Les moteurs sont lancés dans une course sans fin puisqu'il y a
de plus en plus de sites sur le web, donc de plus en plus de pages à
indexer. On estime que les spider peuvent aspirer de 2 à 10 millions de
pages par jour. L'opération demande des ressources machines énormes, ce
qui explique que la mise à jour des moteurs se fait seulement tous les 15
jours, voire tous les mois ou plus, et varie tout le temps...
La recherche effectuée par le moteur se fait en texte intégral.
En clair, les moteurs prennent en compte les mots contenus dans la page.
Ceux placés dans les balises "titre", "description"
et "mots-clés" et situés dans la partie invisible de la page
entre <HEAD> et </HEAD> sont de moins en moins pris en compte
bien que ces "tags" servent spécifiquement au référencement,
donc à la visibilité des sites auprès des moteurs de recherche. Si les
tags sont de plus en plus délaissés c'est pour contourner la triche. En
effet, des petits malins ont pris l'habitude de placer à cet endroit des
mots qui n'ont rien à voir avec l'objet du site mais qui ont l'avantage
d'être très recherchés par l'internaute. Ainsi si vous mettiez dans les
balises des mots très populaires comme sexe, MP3 ou Britney Spears, vous
attiriez automatiquement sur votre site, un grand nombre d'internautes...
Il faut aussi savoir que les moteurs ne se contentent pas de rechercher le
mot seul mais ils prennent également en compte le contexte : plus le
mot recherché est placé haut dans la page, plus la recherche est considérée
comme pertinente, idem s'il est en gras, si son corps (taille) est
important, s'il fait office de lien hypertexte...
Google au crible
Points forts, points
faibles du plus branché des moteurs de
recherche
C'est la star des moteurs de recherche. Il a encore remporté cette
année le trophée du meilleur service de recherche décerné par les spécialistes
du site SearchEngineWatch,
ainsi que le prix du meilleur design, celui du meilleur outil de recherche
d'images, ou encore de la meilleure barre d'outils. Bref, Google ne
constitue plus seulement une référence, il truste le marché, au point
que même le célèbre annuaire Yahoo! s'en sert comme roue de secours
lorsque son annuaire défaille... Mais qu'est ce qu'il a de plus que les
autres ?
Les points forts de Google
Une simplicité d'utilisation
Ses créateurs, deux étudiants de Stanford, Sergey Brin (interviewé par
le journaldunet)
et Larry Page, ont conçu un moteur destiné aux internautes qui ne sont
pas familiarisés avec la syntaxe des moteurs de recherche et qui ne
souhaitent pas se compliquer la tâche. Avec Google, vous n'êtes pas
obligé d'utiliser toutes les ruses des +, -, or, les guillemets... pour
trouver ce que vous cherchez (voir l'abc
des moteurs).
Un nombre de pages indexées important
Google est un poids lourd du secteur : il fait aujourd'hui des recherches
sur environ 2 milliards de pages web, ce qui le classe parmi les plus
"gros" moteurs avec All
the Web (Fast). La moitié sont indexées sur les disques de Google,
l'autre moitié représentent des pages "estimées" dont Google
connaît seulement le lien.
Une rapidité des réponses
Si le moteur n'indexe pas 100% des pages, c'est seulement pour ne pas
alourdir le temps de recherche... Google s'est donné pour objectif de répondre
à une requête en un temps record, quelques secondes, pas plus. Ainsi, la
Home comme les pages de résultat sont très "légères" : le
texte est réduit au strict minimum et les publicités graphiques
consommatrices de kiloctets qui retardent l'affichage des pages, sont
bannies.
Des résultats plutôt pertinents
Google s'appuie sur la notion d'indice de popularité des pages (IPP). En
clair, plus de sites proposent un lien vers une page donnée, plus cette
page est dite "populaire" et plus elle est considérée comme
intéressante. Elle apparaîtra donc en tête des résultats de votre
recherche. Ce critère est aussi utilisé par d'autres moteurs de
recherche comme AltaVista, Infoseek ou Excite mais seul Google l'utilise
en priorité. Ses deux créateurs ont même affiné le système en
calculant aussi l'IPP des pages pointant vers la page donnée. Concrètement,
Google est le seul moteur de recherche qui ne prend pas seulement en
compte le nombre de pages qui pointent vers une page donnée mais la
"qualité" de ces pages, soit l'importance des sites considérés.
Cela permet notamment d'éviter la triche : en effet il serait facile
de créer soi-même des millliers de pages qui pointent vers son propre
site...
Des fonctionnalités originales et pratiques
Google permet de consulter des pages qui n'existent plus mais qui ont été
indexées sur ses "machines" : au lieu de tomber sur le
fameux message "erreur 404", le moteur de recherche est le seul
à vous proposer la page telle qu'elle existait au moment où Google l'a
aspirée. Il s'agit de la fonction "cache". Dans les pages de résultats,
les différentes réponses appartenant au même site sont décalées vers
la droite. Cette fonctionnalité permet de gagner du temps puisqu'elle
regroupe les différentes pages d'un même site. Enfin, si vous choisissez
l'option "j'ai de la chance" au lieu du traditionnel
"Recherche Google", vous tombez directement sur le site web qui
serait arrivé premier de la liste. Ce pari relève plus du jeu que de la
performance mais il faut au moins l'essayer une fois...
Les points faibles de
Google
Les pages récentes et sur des domaines pointus désavantagées
Si son indice de popularité des pages a fait ses preuves, il comporte
aussi plusieurs inconvénients. Par exemple, les pages récentes sont pénalisées
puisque par nature, peu de sites pointent vers elles. De même, les pages
parlant de domaines très pointus (comme celles des universités et des
laboratoires de recherche) vont obtenir un indice de popularité faible
alors qu'elles sont très pertinentes. Ces observations remettent en cause
l'hypothèse d'un lien fort entre "popularité" des pages et
"pertinence" des résultats.
Une syntaxe un peu rigide
Google ne cherche que les pages qui correspondent exactement à vos termes
de recherche. Ainsi, si vous tapez le mot "film", vous
n'obtiendrez pas la même réponse que si vous tapez "films"...
Notez d'ailleurs que Google n'accepte pas actuellement les troncatures
dans le champ de recherche : cette astuce permet de rechercher tous
les mots commençant par exemple par "foot" en écrivant
"foot*" et d'obtenir aussi les pages qui contiennent le mot
"football", "footballeurs"... Ce manque de souplesse
se retrouve aussi sur le cas des mots accentués, Google ne prend en
compte que l'orthographe exacte du mot que vous tapez, alors gare aux
oublis d'accents, ils peuvent vous être fatals.
Pour plus d'informations sur Google, nous vous conseillons d'aller sur le
site Abondance de
Olivier Andrieu, toutes les caractéristiques des moteurs et annuaires
sont décrites sur ce site entièrement consacré aux outils de
recherche... Sachez enfin que Google met à votre disposition une rubrique
"Astuces
de recherche" pour vous aider à bien formuler votre requête et
à interpréter les résultats trouvés...
Au delà de ses performances remarquables, Google s'est
imposé par sa simplicité d'utilisation et par la sobriété de son
interface, cependant au fil du temps le moteur de recherche a discrètement
intégré de nouveaux services, plus utiles les uns que les autres, et
toujours aussi simples d'emploi.
Les options
linguistiques
Google est disponible dans de nombreuses langues, dont le français.
Cette localisation porte aussi bien sur l'interface du moteur de recherche
que sur la langue des documents recherchés ou encore sur le correcteur
orthographique. Google se pose peu à peu comme le champion des outils
linguistiques, à vrai dire, si vous recherchez des documents dans une
langue précise, c'est sans l'ombre d'un doute le moteur à consulter.
Pour disposer de l'interface en français, il suffit de se
rendre à l'adresse www.google.fr
plutôt que sur le site principal en ".com". Il est également
possible de définir une fois pour toute ce paramètre en passant par les
préférences de Google comme on le ferait pour un logiciel. Pour accéder
à la page de configuration de Google, cliquez sur le lien préférences
qui se trouve sur la droite du champ de saisie.
langue de l'interface
Elle se définit au moyen d'un menu déroulant, par curiosité, nous
vous recommandons de jeter un oeil à cette liste
: du gaélique au swahili, le nombre de langues supportées est
impressionnant, en outre l'équipe de Google qui ne manque pas d'humour a
glissé des "oeufs de pâques", par exemple une interface spéciale
"hacker",
une version latine
ou encore une déclinaison en klingon,
une langue parlée que dans la série "Star Trek" !

Le menu de sélection de l'interface
Langue de recherche
Cette option porte sur la langue des documents que le moteur va
retourner à vos requêtes. Si vous modifiez ce paramètre, Google
restreindra son champ d'investigation aux seules langues que vous aurez sélectionnées
en cochant ces cases. Compte tenu de la répartition linguistique du web,
nous vous conseillons si vous optez pour ce mode de filtrage de cocher au
minimum l'anglais, en sus du français.

Le menu de sélection de l'interface
Tri des résultats par langue
Notez bien la présence des trois puces sous le champ de saisie, elles
vous permettront d'un simple clic de filtrer la liste des réponses,
soient en les affichant toutes, soient en les limitant aux pages web
francophones, soit en ne conservant que les résultats franco-français ou
ceux que vous aurez spécifiés dans lers préférences.

Sites du monde entier, de la
francophonie ou français.
Orthographe
Parmi les apports récents de Google, vous aurez sans doute noté
l'apparition d'un correcteur orthographique sous la ligne bleue qui sert
de compte rendu des recherches. Très pratique, cet outil polyglotte détecte
automatiquement les fautes de frappe et les orthographes douteuses et suggère
ses corrections. Simple, discret et d'une remarquable efficacité, bref
c'est du Google craché !

Google corrige lui-même coquilles et fautes
d'orthographe
Traduction
Un peu à la façon de babelfish.altavista.com,
Google abrite sous le lien "Outils linguistiques" un traducteur
automatique, capable de retranscrire un texte ou la totalité
d'une page web entre anglais, allemand, espagnol, français, italien et
portugais. Très rapide, l'outil pêche comme tous ses concurrents par la
piètre qualité de ses traductions, elles constituent au mieux une aide
à la compréhension des documents étrangers. Notez que seuls les
anglophones bénéficient pour l'heure de la totalité du service : sur la
version US du site, il suffit d'un clic sur la commande
"translate" qui accompagne chaque réponse dans une autre langue
que l'anglais, pour en obtenir la traduction automatique.
Les outils de recherche
spécialisés
Images
Google intègre un moteur uniquement dédié à la recherche de photos et
d'illustrations. D'une efficacité étonnante, cette fonctionnalité se
dissimule sous l'onglet Images.
Il suffit de saisir un mot clé, comme on le ferait pour trouver un site
web et de presser le bouton "Rechecher" pour que Google élabore
une liste de planches contact comportant chacune une vingtaine de
vignettes de prévisualisation cliquables pour accéder aux images en
taille réelle.
l
En moins d'une seconde, plus de 4000
photos
de la Tour Eiffel
Les options de recherche avancée permettent d'affiner la
requête, en définissant la taille des images désirées, leur format (jpeg
ou gif), ou encore le type de cliché, entre couleur et noir&blanc.
Google est très efficace, peut-être même trop, attention à l'usage que
vous faites des images ainsi récupérées, vous ne pouvez légalement pas
les exploiter sur votre propre site sans vous acquitter de droits, du
moins lorsqu'elles sont protégées par un coypright. Précisons enfin
pour ceux qui auraient entrevu de possibles applications libidineuses de
cet outil que Google filtre systématiquement (ou presque..) tout contenu
à caractère pornographique.
Groupes de discussion
Moins affriolant, mais tout aussi puissant, Google a mis la main en février
2001 sur l'intégralité des archives Usenet, soit une base de plus
de 500 millions de messages postés dans les groupes de discussions (newsgroup).
Un outil spécifique permet d'interroger cette monumentale somme de
connaissances, vous le trouverez sous l'onglet Groupes.
Là encore, vous disposerez d'options pointues pour restreindre la
recherche à une langue, à un groupe de discussion donné, aux
contributions d'un auteur en particulier, ou à une certaine période (de
1981 à aujourd'hui !).
La recherche avancée et
ses trésors cachés
La recherche avancée
Le lien recherche
avancée sur la droite du champ de saisie dissimule des outils d'une
incroyable puissance. Outre les traditionnels opérateurs booléens (tous
les mots, expression exacte, au moins un mot, sans certains mots) et les
options linguistiques, vous trouverez ici de quoi limiter votre recherche
dans le temps et dans l'espace, en précisant un site web en particulier
ou un domaine (.fr, .com, .uk, etc.).
La recherche plein-texte pour
tous les documents
La possibilité la plus bluffante réside sans conteste dans la recherche
par type de fichier, qui porte bien sûr sur le nom des documents, mais
surtout sur leur contenu. Google indexe ainsi les fichiers .PDF, mais
aussi Word, Excel, PowerPoint, Postscript et RTF. Cette fonctionnalité
est si efficace, qu'elle en serait presque dangereuse, en effet, certaines
entreprises et administrations qui avaient par mégarde laissé traîner
des documents confidentiels sur le web ont ainsi vu leurs secrets s'ébruiter,
par l'indiscrétion de Google !
La barre d'outils Google
Google met à votre disposition une extension pour Internet
Explorer, une barre d'outils qui vient discrètement se greffer à
l'interface du navigateur, sous la barre d'adresse. Muni de ce logiciel
qui se télécharge et s'installe en une poignée de secondes, la
consultation du moteur de recherche s'avère encore plus rapide puisqu'il
n'est plus besoin d'accéder au site pour émettre une requête. Rendez
vous sur notre logithèque
pour tout savoir des possibilités de la Google Toolbar.

La
barre d'outils Google
6
astuces pour mieux utiliser les moteurs
Utiliser un moteur de recherche, c'est bien, apprendre à
s'en servir, c'est parfois une question de survie si vous ne voulez pas être
submergé par un flot de réponses ou vous égarer dans des voies sans
issue. Si selon l'étude de NPD,
77% des internautes seulement sont satisfaits de leur moteur de recherche,
c'est sans doute à cause de la profusion des résultats affichés. Bref,
l'internaute moyen s'y perd. Que faire pour atteindre le plus rapidement
sa cible ? Dans la rubrique "Trucs
et astuces", Olivier Andrieu vous apprend à optimiser vos
recherches sur les différents moteurs et annuaires.
Nous vous rappelons ici quelques précautions élémentaires
à observer pour gagner du temps :
1) Bien penser au(x) mot(s)-clé(s) avant de vous lancer dans une
recherche, la qualité des réponses dépend d'abord de la qualité des
mots choisis. Par exemple, "tabac" ne donne pas les mêmes résultats
que "cigarette" : le premier est plus synonyme de danger pour la
santé tandis que l'autre symbolise plus le plaisir de fumer.
2) Taper les mots en minuscule pour vous donner toutes les chances
de ne pas manquer une référence importante.
3) Taper les mots avec les accents car certains moteurs ne prennent
en compte que l'orthographe exacte des mots.
4) Faites attention à l'ordre des mots que vous utilisez. Sur
certains moteurs, cette occurence a son importance; Exemple, "paris
dakar" ne donne pas le même résultat que "dakar paris".
5) Utilisez les guillemets si votre recherche comporte plusieurs
mots : taper par exemple "mairie de paris" afin que le moteur
prenne bien en compte tous les mots.
6) Utilisez la syntaxe pour affiner votre recherche : les
outils les plus couramment utilisés sont les "+" et les
"-" qui ajoutent des contraintes à votre recherche. Par
exemple, vous pouvez rechercher des documents sur George Lucas qui ne
parlent que de Star Wars (george lucas +star wars) ou au contraire qui ne
parlent pas du film (george lucas -star wars).
Désormais, vous n'avez plus d'excuses pour ne pas trouver ce que vous
cherchez.
L'Internaute (13/02/02)
[F.G
|