Bruit
Réponse qui procure un trop grand nombre de références
et rend aléatoire le tri par l'internaute. Il y a "bruit"
lorsque le taux d'extraction, rapport entre le nombre de documents
pertinents et le nombre de documents non-pertinents extraits est
faible.
|
FTP (Anglais : File Transfer
Protocol)
Protocole Internet par lequel on peut envoyer ou recevoir des fichiers par téléchargement.
|
Indexation
Description du contenu d'un document à l'aide d'un langage
documentaire pour faciliter la mémorisation de l'information
dans un fichier en vue d'une recherche ultérieure. C’est
un processus destiné à représenter par les
éléments d'un langage documentaire ou naturel des
données résultant de l'analyse du contenu d'un document
ou d'une question.
|
Métadonnées
Données qui portent de l'information sur la nature de certaines
autres données pour en permettre une utilisation pertinente.
Les métadonnées
renseignent l'utilisateur sur l'origine et la nature des données
stockées, leur structuration, la manière dont elles
doivent être interprétées ou quant à
l'accès que l'utilisateur peut y avoir
L'élément "meta" dans le
langage HTML peut être utilisé pour identifier les
propriétés d'un document (auteur, date d'expiration,
liste de mots clés, description, etc.).
|
Usenet
- Techniquement : De façon synthétique et simplificatrice, la définition la plus couramment acceptée de Usenet est celle d'un ensemble de machines reliées à différents réseaux qui véhiculent des articles postés dans des groupes de discussion (newsgroups). Les articles véhiculés doivent respecter un format de diffusion standard (RFC-1036) acceptable par tous les réseaux. En effet, chaque réseau a ses particularités et ne transporte pas tous les groupes de discussions. En ce sens il ne faut pas confondre Usenet et Internet, ce dernier n'étant qu'un des réseaux participant au système.
- Humainement : Par extension, Usenet est aussi la communauté des personnes qui lisent et écrivent des articles dans les groupes de discussions auxquels ils ont accès.
|
Rappel
et précision
Deux indicateurs qui permettent de rendre compte de la qualité
globale de la réponse d'un système à une requête
:
La précision : la précision correspond au
pourcentage de documents pertinents renvoyés
par le système qui répondent effectivement à
la requête.
Le rappel : le rappel désigne le pourcentage de
documents pertinents rapportés par le
système par rapport au nombre total de documents pertinents
qui se trouvent dans la base
documentaire.
|
Référencement
Le référencement
est lié à un travail d'optimisation permettant d'augmenter
la visibilité d'un site Web sur internet (à travers
les moteurs et annuaires de recherche) et donc d'accroître
son trafic
|
Robot
Tous les programmes de navigation
qui suivent les liens hypertexte des pages de Web mais qui ne sont
pas directement sous contrôle humain. Les exemples sont les
araignées des moteurs de Recherche, les programmes "harvester"
qui extraient les adresses E-mail à partir des pages Web
ou groupes de News ainsi que différents programmes de recherche
intelligents.
Appelé aussi robot, agent, spider ou encore crawler, il désigne
un logiciel qui scrute les sites web et extrait les pages html (balises
meta, mots et phrases) afin de constituer l'index (base de donnée)
du moteur de recherche
|
Système
expert
Ensemble des logiciels exploitant
dans un domaine particulier des connaissances explicites et organisées,
pouvant se substituer à un expert humain |
Tags
(Français : balises)
Codes spécifiques utilisés pour mettre en forme des
documents html
|
Silence
Un silence qualifie le cas où
un document pertinent n'est pas sélectionné à
l'issue de la recherche. Il y a "silence" lorsque le facteur
de rappel, rapport entre le nombre de documents pertinents extraits
et le nombre de documents pertinents non-extraits, est élevé
|
|