1. Typologie des outils de recherche

 

1.1Moteurs de recherche par mot-clé
1.2 Moteurs de recherche thématique
1.3 Métamoteurs
1.4 A
gents intelligents

 


Un moteur de recherche a pour première fonction d’indexer le plus grand nombre de pages Web. Pour ce faire, il utilise des robots appelés « spider » qui aspirent ces pages Web sur leurs bases. C’est ainsi que lorsque vous faites une recherche, le moteur va chercher dans sa base les pages correspondantes aux mots-clés que vous avez entrés. La recherche effectuée par le moteur de recherche se fait en texte intégral, les moteurs de recherche prennent en compte les mots contenus dans la page. Ceux placés dans les balises « titre », « description » et « mots-clés » et situés dans la partie invisible de la page entre <HEAD> et </HEAD> et sont de moins en moins pris en compte bien que ces tags servent spécifiquement au référencement, donc à la visibilité des pages auprès des moteurs de recherche. Les délaisser est dû au fait que certaines personnes profitent de ces tags pour placer des mots qui n'ont rien à avoir avec l’objet du site, mais qui ont l’avantage d’être très recherchés par les internautes. Pendant la recherche, les moteurs de recherche prennent en compte aussi le contexte : plus le mot recherché est placé en haut de la page, plus le résultat est considéré comme pertinent, idem s’il est en gras, si la taille est importante, ou s’il fait office de lien hypertexte.

 

1.1


Moteurs de recherche par mot-clé

Moteur de recherche par mot-clé général
Ce sont des moteurs de recherche issus d'un programme qui visite une page Web à partir de laquelle il enregistre, compresse et classe les informations dans sa base de données. Cette même page sera visitée régulièrement pour mettre à jour l'information collectée. La recherche se fait en saisissant dans un formulaire un mot ou un groupe de mots reliés par des opérateursde recherche. Ces outils sont très utiles pour rechercher une information précise.
Le plus utilisé actuellement est : Google

Moteur de recherche par mot-clé spécifique
Ce sont des moteurs qui recherchent l'information se trouvant dans des ressources autres que les pages web tels que les news, FTP. La recherche peut s'effectuer soit par des mots-clés, soit sur les titres de news ou le nom de l'auteur. Cet outil permet la prise de connaissance des acteurs et des experts des connaissances. Parmi ces moteurs de recherche, on trouve Fermivista spécialisé en mathématiques.


1.2

Moteurs de recherche thématique

Appelés aussi annuaire ou index. Ce sont des répertoires ou bases de données hiérarchiques regroupant les informations par catégories avec des niveaux plus précis où les informations sont classées par sous-thèmes sous forme d'une arborescence de domaines divisés en sous-domaines, du plus général au plus spécifique, jusqu’à une liste de sites. Ils possèdent une base de données constituée de fiches descriptives de sites web. Ces listes sont élaborées à partir d'une classification humaines par des responsables qui séléctionnent les pages et classent les entrées à l'intérieur du répertoire. L'internaute peut accéder facilement à l'information grâce aux catégories et sous-catégories.Parmi ces moteurs de recherche les plus utilisés : Yahoo


1.3

Métamoteurs

Ils effectuent des recherches simultanées sur plusieurs moteurs de recherche en utilisant leur index. On peut les acquérir par achat ou par téléchargement. Ils permettent ainsi de poser une seule requête simultanément sur plusieurs moteurs et/ou annuaires. Ces outils se caractérisent par une fonction de veille (possibilité de programmer une recherche automatique pour détecter les modifications).
Les métamoteurs se classent en deux catégories : les métamoteurs en ligne d'accès gratuits sur le Web et les métamoteurs off-line appelés aussi méta-moteurs clients ou aussi agents semi-intelligents qui s'installent sur le disque dur comme un navigateur Web. Exemple : Kartoo


1.4

Agents intelligents

Ils ont été développés par des chercheurs en intelligence artificielle, on distingue 5 familles
- Agent de recherche
- Agent web pour améliorer la navigation
- Agent de divertissement pour repérer des données recherchées
- Assistants virtuels
- Agent d’affaires pour repérer les bonnes affaires
Les agents intelligents sont définis par l’AFNOR comme suit « Objet utilisant les techniques de l’intelligence artificielle : il adapte son comportement à son environnement et en mémorisant ses expériences, se comporte comme un sous-système capable d’apprentissage : il enrichit le système qui l’utilise en ajoutant, au cours du temps, des fonctions automatiques de traitement, de contrôle, de mémorisation ou de transfert d’information ».Il est à préciser que les actuels agents intelligents effectuent leur tâche comme agent mais pas intelligent (ils ne prennent pas d’initiatives, ils sont programmés pour effectuer une tâche sans analyser tous les éléments extérieurs).- Composition : une base de connaissance prédéfinie, un moteur d’inférence pour tenir des raisonnements plus ou moins complexes, un système d’acquisition de connaissances, un mécanisme d’apprentissage
- Mode d'action : intermédiaire entre les moteurs et répertoire de recherche et leur index
- Capacités : téléchargement des sites sur le disque dur, programmation du téléchargement, suivi des changements effectués sur les sites, navigation off-line (on peut lancer une requête et se déconnecter, l’agent ira effectuer la recherche sur le web et fournira les résultats à la prochaine connexion)
- Limites : risque de bruit dû à l’utilisation d’outils peu ou non connus, lenteur d’exécution des tâches (éviter de les utiliser en cas d’une recherche urgente). L'exemple le plus connu : Copernic