Le nom "Google" est dérivé du mot "Googol" qui signifie 10 à la puissance 100.

Au sommaire

Au fait, ça marche comment un moteur de recherche?
Dans les coulisses des chercheurs du Web.

Google au crible
Les qualités et les faiblesses du moteur de recherche le plus populaire du moment.

Ces petits services qui font la différence
Outils linguistiques, recherche d'images, ou consultation des archives usenet, Google ne cesse d'introduire de nouveaux services. Mode d'emploi.

Comment mieux utiliser les moteurs de recherche - 6 astuces
Bien rédiger sa demande, utiliser la ponctuation, soigner les accents...

Au fait, ça marche comment un moteur de recherche ?

On les utilise souvent, on est impressionné par leurs capacités sans savoir comment ils fonctionnent. Un moteur de recherche a pour premier travail d'indexer le plus grand nombre de pages web. En clair, Voila, Excite, Google, Altavista et les autres récupérent sur la toile, des millions de pages. Pour cela, les moteurs utilisent des robots appelés des "spider" qui aspirent ces pages web sur ses ordinateurs. Ainsi, lorsque vous faites une requête, le moteur va "fouiller" dans sa base, les pages qui correspondent aux mots-clés que vous avez entrés. Il ne trouvera donc que des pages qu'il a au préalable aspirées. Les moteurs sont lancés dans une course sans fin puisqu'il y a de plus en plus de sites sur le web, donc de plus en plus de pages à indexer. On estime que les spider peuvent aspirer de 2 à 10 millions de pages par jour. L'opération demande des ressources machines énormes, ce qui explique que la mise à jour des moteurs se fait seulement tous les 15 jours, voire tous les mois ou plus, et varie tout le temps...

La recherche effectuée par le moteur se fait en texte intégral. En clair, les moteurs prennent en compte les mots contenus dans la page. Ceux placés dans les balises "titre", "description" et "mots-clés" et situés dans la partie invisible de la page entre <HEAD> et </HEAD> sont de moins en moins pris en compte bien que ces "tags" servent spécifiquement au référencement, donc à la visibilité des sites auprès des moteurs de recherche. Si les tags sont de plus en plus délaissés c'est pour contourner la triche. En effet, des petits malins ont pris l'habitude de placer à cet endroit des mots qui n'ont rien à voir avec l'objet du site mais qui ont l'avantage d'être très recherchés par l'internaute. Ainsi si vous mettiez dans les balises des mots très populaires comme sexe, MP3 ou Britney Spears, vous attiriez automatiquement sur votre site, un grand nombre d'internautes... Il faut aussi savoir que les moteurs ne se contentent pas de rechercher le mot seul mais ils prennent également en compte le contexte : plus le mot recherché est placé haut dans la page, plus la recherche est considérée comme pertinente, idem s'il est en gras, si son corps (taille) est important, s'il fait office de lien hypertexte...

Google au crible

Points forts, points faibles du plus branché des moteurs de recherche

C'est la star des moteurs de recherche. Il a encore remporté cette année le trophée du meilleur service de recherche décerné par les spécialistes du site SearchEngineWatch, ainsi que le prix du meilleur design, celui du meilleur outil de recherche d'images, ou encore de la meilleure barre d'outils. Bref, Google ne constitue plus seulement une référence, il truste le marché, au point que même le célèbre annuaire Yahoo! s'en sert comme roue de secours lorsque son annuaire défaille... Mais qu'est ce qu'il a de plus que les autres ?


Les points forts de Google
Une simplicité d'utilisation
Ses créateurs, deux étudiants de Stanford, Sergey Brin (interviewé par le journaldunet) et Larry Page, ont conçu un moteur destiné aux internautes qui ne sont pas familiarisés avec la syntaxe des moteurs de recherche et qui ne souhaitent pas se compliquer la tâche. Avec Google, vous n'êtes pas obligé d'utiliser toutes les ruses des +, -, or, les guillemets... pour trouver ce que vous cherchez (voir l'abc des moteurs).

Un nombre de pages indexées important
Google est un poids lourd du secteur : il fait aujourd'hui des recherches sur environ 2 milliards de pages web, ce qui le classe parmi les plus "gros" moteurs avec All the Web (Fast). La moitié sont indexées sur les disques de Google, l'autre moitié représentent des pages "estimées" dont Google connaît seulement le lien.

Une rapidité des réponses
Si le moteur n'indexe pas 100% des pages, c'est seulement pour ne pas alourdir le temps de recherche... Google s'est donné pour objectif de répondre à une requête en un temps record, quelques secondes, pas plus. Ainsi, la Home comme les pages de résultat sont très "légères" : le texte est réduit au strict minimum et les publicités graphiques consommatrices de kiloctets qui retardent l'affichage des pages, sont bannies.

Des résultats plutôt pertinents
Google s'appuie sur la notion d'indice de popularité des pages (IPP). En clair, plus de sites proposent un lien vers une page donnée, plus cette page est dite "populaire" et plus elle est considérée comme intéressante. Elle apparaîtra donc en tête des résultats de votre recherche. Ce critère est aussi utilisé par d'autres moteurs de recherche comme AltaVista, Infoseek ou Excite mais seul Google l'utilise en priorité. Ses deux créateurs ont même affiné le système en calculant aussi l'IPP des pages pointant vers la page donnée. Concrètement, Google est le seul moteur de recherche qui ne prend pas seulement en compte le nombre de pages qui pointent vers une page donnée mais la "qualité" de ces pages, soit l'importance des sites considérés. Cela permet notamment d'éviter la triche : en effet il serait facile de créer soi-même des millliers de pages qui pointent vers son propre site...

Des fonctionnalités originales et pratiques
Google permet de consulter des pages qui n'existent plus mais qui ont été indexées sur ses "machines" : au lieu de tomber sur le fameux message "erreur 404", le moteur de recherche est le seul à vous proposer la page telle qu'elle existait au moment où Google l'a aspirée. Il s'agit de la fonction "cache". Dans les pages de résultats, les différentes réponses appartenant au même site sont décalées vers la droite. Cette fonctionnalité permet de gagner du temps puisqu'elle regroupe les différentes pages d'un même site. Enfin, si vous choisissez l'option "j'ai de la chance" au lieu du traditionnel "Recherche Google", vous tombez directement sur le site web qui serait arrivé premier de la liste. Ce pari relève plus du jeu que de la performance mais il faut au moins l'essayer une fois...

Les points faibles de Google
Les pages récentes et sur des domaines pointus désavantagées
Si son indice de popularité des pages a fait ses preuves, il comporte aussi plusieurs inconvénients. Par exemple, les pages récentes sont pénalisées puisque par nature, peu de sites pointent vers elles. De même, les pages parlant de domaines très pointus (comme celles des universités et des laboratoires de recherche) vont obtenir un indice de popularité faible alors qu'elles sont très pertinentes. Ces observations remettent en cause l'hypothèse d'un lien fort entre "popularité" des pages et "pertinence" des résultats.

Une syntaxe un peu rigide
Google ne cherche que les pages qui correspondent exactement à vos termes de recherche. Ainsi, si vous tapez le mot "film", vous n'obtiendrez pas la même réponse que si vous tapez "films"... Notez d'ailleurs que Google n'accepte pas actuellement les troncatures dans le champ de recherche : cette astuce permet de rechercher tous les mots commençant par exemple par "foot" en écrivant "foot*" et d'obtenir aussi les pages qui contiennent le mot "football", "footballeurs"... Ce manque de souplesse se retrouve aussi sur le cas des mots accentués, Google ne prend en compte que l'orthographe exacte du mot que vous tapez, alors gare aux oublis d'accents, ils peuvent vous être fatals.

Pour plus d'informations sur Google, nous vous conseillons d'aller sur le site Abondance de Olivier Andrieu, toutes les caractéristiques des moteurs et annuaires sont décrites sur ce site entièrement consacré aux outils de recherche... Sachez enfin que Google met à votre disposition une rubrique "Astuces de recherche" pour vous aider à bien formuler votre requête et à interpréter les résultats trouvés...

 

Ces services qui font la différence

Au delà de ses performances remarquables, Google s'est imposé par sa simplicité d'utilisation et par la sobriété de son interface, cependant au fil du temps le moteur de recherche a discrètement intégré de nouveaux services, plus utiles les uns que les autres, et toujours aussi simples d'emploi.

Les options linguistiques
Google est disponible dans de nombreuses langues, dont le français. Cette localisation porte aussi bien sur l'interface du moteur de recherche que sur la langue des documents recherchés ou encore sur le correcteur orthographique. Google se pose peu à peu comme le champion des outils linguistiques, à vrai dire, si vous recherchez des documents dans une langue précise, c'est sans l'ombre d'un doute le moteur à consulter.

Pour disposer de l'interface en français, il suffit de se rendre à l'adresse www.google.fr plutôt que sur le site principal en ".com". Il est également possible de définir une fois pour toute ce paramètre en passant par les préférences de Google comme on le ferait pour un logiciel. Pour accéder à la page de configuration de Google, cliquez sur le lien préférences qui se trouve sur la droite du champ de saisie.

 langue de l'interface
Elle se définit au moyen d'un menu déroulant, par curiosité, nous vous recommandons de jeter un oeil à cette liste : du gaélique au swahili, le nombre de langues supportées est impressionnant, en outre l'équipe de Google qui ne manque pas d'humour a glissé des "oeufs de pâques", par exemple une interface spéciale "hacker", une version latine ou encore une déclinaison en klingon, une langue parlée que dans la série "Star Trek" !


Le menu de sélection de l'interface

Langue de recherche
Cette option porte sur la langue des documents que le moteur va retourner à vos requêtes. Si vous modifiez ce paramètre, Google restreindra son champ d'investigation aux seules langues que vous aurez sélectionnées en cochant ces cases. Compte tenu de la répartition linguistique du web, nous vous conseillons si vous optez pour ce mode de filtrage de cocher au minimum l'anglais, en sus du français.


Le menu de sélection de l'interface

Tri des résultats par langue
Notez bien la présence des trois puces sous le champ de saisie, elles vous permettront d'un simple clic de filtrer la liste des réponses, soient en les affichant toutes, soient en les limitant aux pages web francophones, soit en ne conservant que les résultats franco-français ou ceux que vous aurez spécifiés dans lers préférences.


Sites du monde entier, de la francophonie ou français.

Orthographe
Parmi les apports récents de Google, vous aurez sans doute noté l'apparition d'un correcteur orthographique sous la ligne bleue qui sert de compte rendu des recherches. Très pratique, cet outil polyglotte détecte automatiquement les fautes de frappe et les orthographes douteuses et suggère ses corrections. Simple, discret et d'une remarquable efficacité, bref c'est du Google craché !


Google corrige lui-même coquilles et fautes d'orthographe

Traduction
Un peu à la façon de babelfish.altavista.com, Google abrite sous le lien "Outils linguistiques" un traducteur automatique, capable de retranscrire un texte ou la totalité d'une page web entre anglais, allemand, espagnol, français, italien et portugais. Très rapide, l'outil pêche comme tous ses concurrents par la piètre qualité de ses traductions, elles constituent au mieux une aide à la compréhension des documents étrangers. Notez que seuls les anglophones bénéficient pour l'heure de la totalité du service : sur la version US du site, il suffit d'un clic sur la commande "translate" qui accompagne chaque réponse dans une autre langue que l'anglais, pour en obtenir la traduction automatique.

Les outils de recherche spécialisés

Images
Google intègre un moteur uniquement dédié à la recherche de photos et d'illustrations. D'une efficacité étonnante, cette fonctionnalité se dissimule sous l'onglet Images. Il suffit de saisir un mot clé, comme on le ferait pour trouver un site web et de presser le bouton "Rechecher" pour que Google élabore une liste de planches contact comportant chacune une vingtaine de vignettes de prévisualisation cliquables pour accéder aux images en taille réelle.

l
En moins d'une seconde, plus de 4000 photos
de la Tour Eiffel

Les options de recherche avancée permettent d'affiner la requête, en définissant la taille des images désirées, leur format (jpeg ou gif), ou encore le type de cliché, entre couleur et noir&blanc.
Google est très efficace, peut-être même trop, attention à l'usage que vous faites des images ainsi récupérées, vous ne pouvez légalement pas les exploiter sur votre propre site sans vous acquitter de droits, du moins lorsqu'elles sont protégées par un coypright. Précisons enfin pour ceux qui auraient entrevu de possibles applications libidineuses de cet outil que Google filtre systématiquement (ou presque..) tout contenu à caractère pornographique.

Groupes de discussion
Moins affriolant, mais tout aussi puissant, Google a mis la main en février 2001 sur l'intégralité des archives Usenet, soit une base de plus de 500 millions de messages postés dans les groupes de discussions (newsgroup). Un outil spécifique permet d'interroger cette monumentale somme de connaissances, vous le trouverez sous l'onglet Groupes. Là encore, vous disposerez d'options pointues pour restreindre la recherche à une langue, à un groupe de discussion donné, aux contributions d'un auteur en particulier, ou à une certaine période (de 1981 à aujourd'hui !).
 

La recherche avancée et ses trésors cachés

La recherche avancée
Le lien recherche avancée sur la droite du champ de saisie dissimule des outils d'une incroyable puissance. Outre les traditionnels opérateurs booléens (tous les mots, expression exacte, au moins un mot, sans certains mots) et les options linguistiques, vous trouverez ici de quoi limiter votre recherche dans le temps et dans l'espace, en précisant un site web en particulier ou un domaine (.fr, .com, .uk, etc.).

La recherche plein-texte pour tous les documents
La possibilité la plus bluffante réside sans conteste dans la recherche par type de fichier, qui porte bien sûr sur le nom des documents, mais surtout sur leur contenu. Google indexe ainsi les fichiers .PDF, mais aussi Word, Excel, PowerPoint, Postscript et RTF. Cette fonctionnalité est si efficace, qu'elle en serait presque dangereuse, en effet, certaines entreprises et administrations qui avaient par mégarde laissé traîner des documents confidentiels sur le web ont ainsi vu leurs secrets s'ébruiter, par l'indiscrétion de Google !

 

La barre d'outils Google
Google met à votre disposition une extension pour Internet Explorer, une barre d'outils qui vient discrètement se greffer à l'interface du navigateur, sous la barre d'adresse. Muni de ce logiciel qui se télécharge et s'installe en une poignée de secondes, la consultation du moteur de recherche s'avère encore plus rapide puisqu'il n'est plus besoin d'accéder au site pour émettre une requête. Rendez vous sur notre logithèque pour tout savoir des possibilités de la Google Toolbar.


La barre d'outils Google

6 astuces pour mieux utiliser les moteurs

Utiliser un moteur de recherche, c'est bien, apprendre à s'en servir, c'est parfois une question de survie si vous ne voulez pas être submergé par un flot de réponses ou vous égarer dans des voies sans issue. Si selon l'étude de NPD, 77% des internautes seulement sont satisfaits de leur moteur de recherche, c'est sans doute à cause de la profusion des résultats affichés. Bref, l'internaute moyen s'y perd. Que faire pour atteindre le plus rapidement sa cible ? Dans la rubrique "Trucs et astuces", Olivier Andrieu vous apprend à optimiser vos recherches sur les différents moteurs et annuaires.

Nous vous rappelons ici quelques précautions élémentaires à observer pour gagner du temps :
1) Bien penser au(x) mot(s)-clé(s) avant de vous lancer dans une recherche, la qualité des réponses dépend d'abord de la qualité des mots choisis. Par exemple, "tabac" ne donne pas les mêmes résultats que "cigarette" : le premier est plus synonyme de danger pour la santé tandis que l'autre symbolise plus le plaisir de fumer.
2) Taper les mots en minuscule pour vous donner toutes les chances de ne pas manquer une référence importante.
3) Taper les mots avec les accents car certains moteurs ne prennent en compte que l'orthographe exacte des mots.
4) Faites attention à l'ordre des mots que vous utilisez. Sur certains moteurs, cette occurence a son importance; Exemple, "paris dakar" ne donne pas le même résultat que "dakar paris".
5) Utilisez les guillemets si votre recherche comporte plusieurs mots : taper par exemple "mairie de paris" afin que le moteur prenne bien en compte tous les mots.
6) Utilisez la syntaxe pour affiner votre recherche : les outils les plus couramment utilisés sont les "+" et les "-" qui ajoutent des contraintes à votre recherche. Par exemple, vous pouvez rechercher des documents sur George Lucas qui ne parlent que de Star Wars (george lucas +star wars) ou au contraire qui ne parlent pas du film (george lucas -star wars).

Désormais, vous n'avez plus d'excuses pour ne pas trouver ce que vous cherchez.

L'Internaute (13/02/02)

[F.G