Les moteurs de recherche sur Internet.

Présentation

Il existe des sites spécialisés dans la recherche d'information. Ces sites utilisent des logiciels que l'on appelle des robots informatiques (crawler, worm, spiders, wanderer, etc.) qui recherchent les informations contenues sur les sites Internet et les organisent en banques de données interrogeables grâce à des logiciels que l'on appelle des moteurs de recherche.

Ils sont apparus en 1994 (le premier vraiment connu était Lycos). Aujourd'hui il en existe de plus en plus. Chacun explore le Web de façon différente, chacun a ses propres règles d'indexation, chacun donne donc des résultats différents. La plupart sont en anglais mais ils intègrent maintenant des interfaces en français

Trouver ce que l'on cherche parmi des millions de pages html qui ne cessent de s'accroître demande un peu d'entraînement, une connaissance des outils de recherche disponibles et surtout de la méthode, de la méthode ...

La recherche.

En bref.

La logique booléenne fournit plusieurs connecteurs de mots-clés : ET (AND en anglais car le système de recherche utilise en général cette langue), OU (OR) et parfois NON (NOT) et même PRÈS (NEAR). Tous les systèmes de recherche ne permettent pas de les utiliser. Chaque moteur a souvent ses propres règles mais on peut convenir généralement que :

 

Les moteurs incontournables.

Google 

Dont le nom est issu du terme mathématique Googol qui désigne le chiffre 10 élevé à la puissance 100, a été créé en 1998 par deux étudiants de l'université de Standford, Sergei Brin et Larry Page, il s'est imposé comme le moteur de recherche le plus utilisé sur Internet, totalisant en France plus de 35 % des requêtes. Il doit son efficacité à plus de 6000 PC répartis en trois centres de calculs à travers le monde Il reçoit 150 millions de requêtes quotidiennes..

Alta Vista

Alta Vista reste un outil de recherche très performant (de la société Digital) qui repose sur une base de données comprenant des millions de pages Web. Une documentation plus détaillée sur l'utilisation de ce moteur se trouve à http://csidoc.insa-lyon.fr/sapristi/fristi15.html

Lycos 

Lycos utilise un index volumineux de plus de11 millions de pages Web.  Aide Lycos 

Yahoo 

La recherche sur Yahoo se fait en cherchant une catégorie de sujet, puis en descendant dans une sous-catégorie, puis dans une autre, etc... C'est une base de données très complète développée à l'origine par l'université de Stanford, la base Yahoo est maintenant maintenue par ses concepteurs, organisés en société indépendante.  Contrairement aux moteurs de recherche, Yahoo présente les pages par leur URL, suivi d'un commentaire de deux ou trois lignes.

Infoseek

Les moteurs français.

Ce sont souvent des catalogues pourvus d'un moteur de recherche. Leur contenu est donc indexé par des personnes et non par des robots informatiques. Le contenu de leurs bases est certes moins considérable que celui amassé comparativement par un robot, mais leurs bases sont plus cohérentes et posent moins de problèmes de bruit au moment de la recherche.

Nomade (http://www.nomade.tiscali.fr/)

Eurêka (http://www.eureka-fr.com) créé le 13 mai 1996. 

Qui Quoi Ou France Telecom (http://www.wanadoo.fr/qqo).

QuiQuoiOu, l'annuaire des services francophones de Wanadoo, est ouvert à tous. La recherche se fait librement ou à l'aide d'un classement thématique. QuiQuoiOu regroupe
 
Recherche du CNRS.
Orienté vers les universités et la recherche.
 
La France
Une liste des serveurs en France mais qui n'est pas toujours d'actualité.

Dans les pays francophones.

Francité (http://www.i3d.qc.ca/francite.htm)  

Francité est le plus renommé des sites de recherche québécois. 

Un site de recherche Suisse.

 

Partir à la recherche d'anciennes connaissances.

Pour apparaître dans ces moteurs, il est indispensable de s'y enregistrer au préalable. Cette opération gratuite permettra à vos correspondants d'y recourir pour vous retrouver.

Four 11  repris par Yahoo http://people.yahoo.com/ 
 se propose de retrouver une adresse e-mail à partir d'un nom et d'un prénom d'utilisateur. Il correspond aux Pages Blanches d'Internet. C'est le moteur le plus utilisé lorsque vous ne vous souvenez plus exactement de l'adresse e-mail d'un correspondant ou si vous souhaitez savoir s'il en possède une. Les critères de recherche sont très nombreux et parfois totalement incongrus (écoles ou universités fréquentées, hobbies...). Cependant, sa notoriété en fait un incontournable.
 
IAF 
IAF essaie de trouver l'adresse e-mail d'un correspondant mais également de trouver son nom exact.
 
Who Where
 

Pour rechercher des programmes.

Ftp Search repris par  http://www.alltheweb.com
Spécialisé dans la recherche des sites Ftp. Lorsqu'on lance une requête sur Ftp Search en entrant un nom de fichier, on trouve immédiatement la liste des serveurs où il est disponible.

Recherche dans les news.

Dejanews repris par http://groups.google.com/ 
Moteur de permettant de rechercher dans tous les groupes de discussion existants, les messages qui concernent un sujet donné. La base de données explorée étant très importante, les temps de recherche peuvent être assez long
 

Pour en savoir plus sur html et le web

Un Nouveau Guide Internet- Gilles MAIRE- Très complet

http://www.unites.uqam.ca/bib/outils/rech_int.htm

http://www-scd-ulp.u-strasbg.fr/urfist/recherche_information/sommair.htm

http://www.pratique.fr/net/guide/recherche.html

http://www.bibl.ulaval.ca/vitrine/giri/mod2/2ex1.htm