Les moteurs de recherche sur Internet.
Il existe des sites spécialisés dans la recherche d'information.
Ces sites utilisent des logiciels que l'on appelle des robots
informatiques (crawler, worm, spiders, wanderer, etc.) qui
recherchent les informations contenues sur les sites Internet et
les organisent en banques de données interrogeables grâce à
des logiciels que l'on appelle des moteurs de recherche.
Ils sont apparus en 1994 (le premier vraiment connu était
Lycos). Aujourd'hui il en existe de plus en plus. Chacun
explore le Web de façon différente, chacun a ses propres règles
d'indexation, chacun donne donc des résultats différents.
La plupart sont en anglais mais ils intègrent maintenant des
interfaces en français
Trouver ce que l'on cherche parmi des millions de pages html
qui ne cessent de s'accroître demande un peu d'entraînement,
une connaissance des outils de recherche disponibles et surtout de
la méthode, de la méthode ...
- Ce qui est proche de chez vous est plus facile d'accès
explorez d'abord les serveurs de votre ville, puis ceux
de votre pays, puis enfin tout le reste. Pour vous entraîner,
sur ac-nancy-metz.fr vous avez un moteur de recherche qui
explore uniquement ce serveur.
- http://www.ac-nancy-metz.fr/cherche/default.htm
- La connaissance s'acquiert lentement notez et
enregistrez les bonnes adresses.
La recherche.
En bref.
La logique booléenne fournit plusieurs connecteurs de mots-clés
: ET (AND en anglais car le système de recherche utilise en général
cette langue), OU (OR) et parfois NON (NOT) et même PRÈS (NEAR).
Tous les systèmes de recherche ne permettent pas de les utiliser.
Chaque moteur a souvent ses propres règles mais on peut convenir
généralement que :
- "Roméo" and "Juliette"
retourne tous les documents qui contiennent à la fois
Roméo et Juliette.
- "Roméo" or "Juliette"
retourne tous les documents qui contiennent le mot Roméo
ou le mot Juliette.
- "Roméo" not "Juliette"
retourne tous les documents qui contiennent le mot Roméo
mais pas Juliette.
- Sil* retourne les documents contenant les
mots commençant par sil.
- Date > 1/1/97 retourne tous les
documents dont le champ date est supérieur au 1/1/97.
- THESAURUS "voyage" retourne les
documents qui contiennent le mot voyage mais aussi
excursion, promenade, croisière ...
- gestion NEAR document retourne les
documents qui contiennent ces deux mots avec un score d'autant
plus élevé qu'ils sont proches.
Dont le nom est issu du terme mathématique Googol qui désigne le chiffre 10
élevé à la puissance 100, a été créé en 1998 par deux étudiants de
l'université de Standford, Sergei Brin et Larry Page, il s'est imposé comme le
moteur de recherche le plus utilisé sur Internet, totalisant en France plus de
35 % des requêtes. Il doit son efficacité à plus de 6000 PC répartis en
trois centres de calculs à travers le monde Il reçoit 150 millions de
requêtes quotidiennes..
Alta Vista reste un outil de recherche très performant (de
la société Digital) qui repose sur une base de données
comprenant des millions de pages Web. Une documentation plus détaillée sur l'utilisation de
ce moteur se trouve à http://csidoc.insa-lyon.fr/sapristi/fristi15.html
Lycos utilise un index volumineux de plus de11 millions
de pages Web. Aide
Lycos
La recherche sur Yahoo se fait en cherchant une catégorie
de sujet, puis en descendant dans une sous-catégorie,
puis dans une autre, etc... C'est une base de données très
complète développée à l'origine par l'université de
Stanford, la base Yahoo est maintenant maintenue par ses
concepteurs, organisés en société indépendante.
Contrairement aux moteurs de recherche, Yahoo
présente les pages par leur URL, suivi d'un commentaire
de deux ou trois lignes.
Ce sont souvent des catalogues pourvus d'un moteur de
recherche. Leur contenu est donc indexé par des personnes et non
par des robots informatiques. Le contenu de leurs bases est
certes moins considérable que celui amassé comparativement par
un robot, mais leurs bases sont plus cohérentes et posent moins
de problèmes de bruit au moment de la recherche.
- QuiQuoiOu, l'annuaire des services francophones de
Wanadoo, est ouvert à tous. La recherche se fait
librement ou à l'aide d'un classement thématique.
QuiQuoiOu regroupe
-
- Recherche
du CNRS.
- Orienté vers les universités et la
recherche.
-
- La
France
- Une liste des serveurs en France mais qui n'est pas
toujours d'actualité.
Dans les pays francophones.
- Francité est le plus renommé des sites de recherche québécois.
Un site de recherche Suisse.
-
Pour apparaître dans ces moteurs, il est
indispensable de s'y enregistrer au préalable. Cette
opération gratuite permettra à vos correspondants d'y recourir
pour vous retrouver.
- Four 11 repris par Yahoo http://people.yahoo.com/
- se propose de retrouver une adresse e-mail à
partir d'un nom et d'un prénom d'utilisateur. Il
correspond aux Pages Blanches d'Internet. C'est le moteur
le plus utilisé lorsque vous ne vous souvenez plus
exactement de l'adresse e-mail d'un correspondant ou si
vous souhaitez savoir s'il en possède une. Les critères
de recherche sont très nombreux et parfois totalement
incongrus (écoles ou universités fréquentées, hobbies...).
Cependant, sa notoriété en fait un incontournable.
-
- IAF
- IAF essaie de trouver l'adresse e-mail d'un correspondant
mais également de trouver son nom exact.
-
- Who Where
-
Pour rechercher des programmes.
- Ftp Search repris
par http://www.alltheweb.com
- Spécialisé dans la recherche des sites Ftp. Lorsqu'on
lance une requête sur Ftp Search en entrant un nom de
fichier, on trouve immédiatement la liste des serveurs où
il est disponible.
Recherche dans les news.
- Dejanews repris par http://groups.google.com/
- Moteur de permettant de rechercher dans tous les groupes
de discussion existants, les messages qui concernent un
sujet donné. La base de données explorée étant très
importante, les temps de recherche peuvent être assez
long
-
Pour en savoir plus sur html et le web
Un Nouveau
Guide Internet- Gilles MAIRE- Très complet
http://www.unites.uqam.ca/bib/outils/rech_int.htm
http://www-scd-ulp.u-strasbg.fr/urfist/recherche_information/sommair.htm
http://www.pratique.fr/net/guide/recherche.html
http://www.bibl.ulaval.ca/vitrine/giri/mod2/2ex1.htm