logo Mkadmi
Accueil            ISD            Equipe de recherche           Laboratoire Paragraphe            Enssib         ECP           Contact  

Accueil

 

 
 
 
 
   

 
 

webmaster

 
 
Moteurs de recherche

 

Le web : concepts et protocoles…

Échanger : HTTP : Un client soumet une requête auprès d’un serveur. Le serveur répond au client.
Ce dialogue s’effectue selon une convention ou protocole appelé HTTP
Localiser : URL : Il est nécessaire de pouvoir donner une adresse unique à chaque ressource du réseau
C’est le rôle de l’URL, Uniforme Ressource Locator
service://hôte:port/chemin/fichier
Formaliser : HTML
Se déplacer : Browser/navigateur/butineur/fureteur
Produits : 1er logiciel: Mosaic de NCSA,
1994, Nescape Navigator, Internet Explorer
Moteur de recherche : Web spécialisé dans la recherche de l’information sur Internet. Ils sont alimentés en permanence avec des bases de données. La recherche se fait par mot clé

Moteurs de recherche

Google : www.google.com, www.google.fr
Yahoo : www.yahoo.com, www.yahoo.fr
Infoseek : www.infoseek.com
Excite : www.excite.com
Lycos : www.Lycos.com
Magellan : www.magellan.com
AltaVista : www.altaVista.com
Voilà : www.voilà.com

Les opérateurs : cerner sa recherche

Sur les moteurs de recherche généraux, c'est à dire ceux ayant de très importantes bases de données, n'importe quelle requête simple retourne plusieurs dizaines de milliers de résultats. Sauf chance exceptionnelle, les sites potentiellement intéressants ayant trait au sujet recherché sont noyés dans des milliers d'informations inutiles.
Lorsque c'est possible, l'utilisation d'opérateurs restreint considérablement le champ de la recherche en diminuant le "bruit".

[ Le "bruit" produit par un moteur de recherche est constitué par tous les résultats inutiles générés par une requête]
Limitation de certains champs

title:x
Le mot ou la phrase doit être dans le champ titre ou dans le meta-titre.Note : pas d'espace entre title, les deux points et l'expression
title:chocolat recherche les pages dont le titre contient chocolat.
title:"chocolat au lait"
title:((chocolat OR praline) AND (serbe OR irakienne))
url:x
Le mot doit être dans l'URL ou l'adresse du site. url:dingue.com recherche les pages dont l'URL ou l'adresse contient "dingue.com", comme www.dingue.com ou www.dingue.com/parano.fr.
text:x Le mot ou la phrase peuvent être n'importe où dans le texte de la page.
Note : cela exclut images, liens et URLs.
text:"accroche-toi au pinceau" recherche les pages dont le texte contient cette phrase.
link: x Le mot ou la phrase doivent être dans le lien, mais pas nécessairement dans l'URL. Les liens sont des URLs renvoyant à d'autres documents.
L'adresse d'une page est une URL; dans cette page, il y a des liens.
Attention : omettre le http://
link:yahoo.com recherche les pages ayant un lien vers "yahoo.com".
link:yahoo.com AND NOT url:yahoo.com recherche les pages ayant un lien vers "yahoo.com" mais n'ayant pas dans leur URL "yahoo.com". (=les pages renvoyant vers "yahoo.com" mais n'étant pas dans "yahoo.com"). C'est clair ? :-)
image:x Recherche les images dont le nom contient x. image:coquelicot recherche les images dont le nom contient "coquelicot" comme coquelicot.jpg ou groscoquelicots.bmp.
anchor:x Recherche les pages ayant des boutons ou des liens contenant le mot ou la phrase dans le texte de l'hyperlien. anchor:moteur recherche les liens disant "moteur". Par exemple, mon lien moteur renvoie sur www.yahoo.com. Si mon lien s'était appelé vroum, anchor:moteur ne l'aurait pas trouvé, même s'il renvoie toujours sur www.yahoo.com.
host: x Recherche les pages sur un hôte déterminé.
Un hôte est par exemple "multimania.com" ou "www.yahoo.com". A ne pas confondre avec le domaine qui est "fr" ou "com".
host:multimania.com recherche les pages sur le serveur multimania.com.
domain:x Recherche les pages appartenant à un domaine déterminé. domain:org recherche les pages appartenant au domaine "org".
applet:x Recherche les pages contenant l'applet Java x. applet:morph
Recherche de Phrases
"phrase" Recherche les pages contenant les mots ou la phrase exacte. "les carottes sont cuites" est différent de "les carottes sont crues".
Troncature
xxxx* * remplace une suite de caractères (jusqu'à 5). Peut être au milieu d'un mot. chocolat* trouve chocolat, chocolatine ou chocolaté.
Opérateurs booléens
x AND y Recherche les pages contenant x ET y. dopage AND festina trouve les pages contenant à la fois "dopage" et "festina"
x OR y Recherche les pages contenant x OU y. dopage OR festina trouve les pages contenant "dopage" OU "festina"
x AND NOT y Recherche les pages contenant x MAIS PAS y. festina AND NOT dopage trouve les pages contenant "festina", mais pas "dopage". (rares)
x NEAR/n y Recherche les pages dont x est éloigné de y d'au plus n occurrences.
Pratique pour trouver des termes associés dans le même contexte.
festina NEAR/5 dopage trouve les pages dont "festina" est éloigné de "dopage" d'au plus 5 mots.
( ) Les parenthèses groupent des actions. dopage AND (football OR cyclisme) trouve les résultats contenant dopage ET football, OU dopage ET cyclisme.
Opérateurs booléens : équivalence
OR |
AND &
ou +
AND NOT &! ou -
NEAR/n ^n

Syntaxe de recherche : Google

  • Il y a quelques règles à connaître avant de taper une requête sur Google (dans les exemples qui suivent, la ligne de saisie est représentée par des crochets) :
    • Pour rechercher plusieurs mots : taper les mots séparés par un espace.  Ex. [vache folle]
    • Pour rechercher au moins un mot parmi plusieurs : taper les mots séparés par "OR" (en majuscules).  Ex. [vache OR vachette]
    • Pour éviter les pages contenant un mot particulier : coller un signe moins devant le mot.  Ex. [vache -folle]
    • Pour rechercher une expression composée : utiliser des guillemets.  Ex. ["vache folle"]
    • L'ordre des mots influe sur le résultat, le premier ayant plus de "poids".  Comparer [jean moulin] avec [moulin jean]
    • Les mots vides sont ignorés (ils semblent pourtant influer sur le résultat !).  Comparer [jean fontaine] avec [jean de la fontaine]
    • Les majuscules et les signes diacritiques (accents, cédille, tilde) sont neutralisés (même remarque...).  Comparer [Eléphant] avec [elephant]
    • Pour forcer la recherche d'une orthographe précise ou d'un mot vide : coller un signe plus devant.  Ex. [+éléphant] affichera prioritairement les pages en français.
      Il n'y a pas de troncature de mots : il faut saisir les mots en entier.  Ex. [vache*] ne recherche pas "vaches", "vachette", "vacherin", etc.
    • Pour indiquer une plage numérique : utiliser deux points de suspension.  Ex. ["1000..2000 euros"] recherche un prix compris entre 1000 et 2000 euros.
    Il existe aussi des opérateurs servant à restreindre la recherche. Par exemple, pour rechercher de façon systématique le mot "vache" dans le titre d'une page, taper : [intitle:vache] .

    Opérateurs dits de "ciblage"

    opérateur
    Effet
    intitle:mot Recherche le mot dans le titre de la page.
    allintitle:mots Recherche tous les mots dans le titre de la page.
    inurl:mot Recherche le mot dans l'adresse de la page.
    allinurl:mots Recherche tous les mots dans l'adresse de la page.
    allinanchor:mots Recherche tous les mots dans les liens de la page.
    allintext:mots Recherche tous les mots dans le corps de la page.
    filetype:format Recherche des documents dans un format particulier : doc, pdf, ppt, ps, rtf, xls (resp. Word, PDF, PowerPoint, PostScript, RTF, Excel).
    site:url Recherche des pages dans un site ou un domaine précis. L'URL peut être complète (site:www.bnf.fr) ou partielle (site:.fr).
 
Accueil            ISD            Equipe de recherche           Laboratoire Paragraphe            Enssib         ECP           Contact