9. Glossaire

 
Bruit
Réponse qui procure un trop grand nombre de références et rend aléatoire le tri par l'internaute. Il y a "bruit" lorsque le taux d'extraction, rapport entre le nombre de documents pertinents et le nombre de documents non-pertinents extraits est faible.
FTP (Anglais : File Transfer Protocol)
Protocole Internet par lequel on peut envoyer ou recevoir des fichiers par téléchargement.
Indexation
Description du contenu d'un document à l'aide d'un langage documentaire pour faciliter la mémorisation de l'information dans un fichier en vue d'une recherche ultérieure. C’est un processus destiné à représenter par les éléments d'un langage documentaire ou naturel des données résultant de l'analyse du contenu d'un document ou d'une question.

Métadonnées
Données qui portent de l'information sur la nature de certaines autres données pour en permettre une utilisation pertinente.
Les métadonnées renseignent l'utilisateur sur l'origine et la nature des données stockées, leur structuration, la manière dont elles doivent être interprétées ou quant à l'accès que l'utilisateur peut y avoir
L'élément "meta" dans le langage HTML peut être utilisé pour identifier les propriétés d'un document (auteur, date d'expiration, liste de mots clés, description, etc.).

Usenet
- Techniquement : De façon synthétique et simplificatrice, la définition la plus couramment acceptée de Usenet est celle d'un ensemble de machines reliées à différents réseaux qui véhiculent des articles postés dans des groupes de discussion (newsgroups). Les articles véhiculés doivent respecter un format de diffusion standard (RFC-1036) acceptable par tous les réseaux. En effet, chaque réseau a ses particularités et ne transporte pas tous les groupes de discussions. En ce sens il ne faut pas confondre Usenet et Internet, ce dernier n'étant qu'un des réseaux participant au système.
- Humainement : Par extension, Usenet est aussi la communauté des personnes qui lisent et écrivent des articles dans les groupes de discussions auxquels ils ont accès.
Rappel et précision
Deux indicateurs qui permettent de rendre compte de la qualité globale de la réponse d'un système à une requête :
La précision : la précision correspond au pourcentage de documents pertinents renvoyés
par le système qui répondent effectivement à la requête.
Le rappel : le rappel désigne le pourcentage de documents pertinents rapportés par le
système par rapport au nombre total de documents pertinents qui se trouvent dans la base
documentaire.

Référencement
Le référencement est lié à un travail d'optimisation permettant d'augmenter la visibilité d'un site Web sur internet (à travers les moteurs et annuaires de recherche) et donc d'accroître son trafic
Robot
Tous les programmes de navigation qui suivent les liens hypertexte des pages de Web mais qui ne sont pas directement sous contrôle humain. Les exemples sont les araignées des moteurs de Recherche, les programmes "harvester" qui extraient les adresses E-mail à partir des pages Web ou groupes de News ainsi que différents programmes de recherche intelligents.
Appelé aussi robot, agent, spider ou encore crawler, il désigne un logiciel qui scrute les sites web et extrait les pages html (balises meta, mots et phrases) afin de constituer l'index (base de donnée) du moteur de recherche


Système expert
Ensemble des logiciels exploitant dans un domaine particulier des connaissances explicites et organisées, pouvant se substituer à un expert humain
Tags (Français : balises)
Codes spécifiques utilisés pour mettre en forme des documents html

Silence
Un silence qualifie le cas où un document pertinent n'est pas sélectionné à l'issue de la recherche. Il y a "silence" lorsque le facteur de rappel, rapport entre le nombre de documents pertinents extraits et le nombre de documents pertinents non-extraits, est élevé