Quelques conseils utiles

Recherche en texte libre

Qu'est-ce que la recherche en texte libre ?
La recherche en texte libre permet de retrouver les notices dont le titre et les vedettes-matière contiennent les mots représentés par le ou les termes de recherche.
Qu'est-ce qu'un mot ?

La définition d'un mot est purement formelle : un mot est une suite de caractères alphabétiques et numériques bordée de séparateurs typographiques (espaces, caractères de ponctuation) ou le début ou la fin du texte. Dans ce système, la recherche s'applique à tous les mots de minimum 4 caractères, sauf les mots d'arrêt, provenant du titre et des vedettes-matière.

Qu'est-ce qu'une troncature ?
La troncature est une opération qui consiste à remplacer la fin d'un mot à partir de son radical par un opérateur de troncature qui représente n'importe quelle suite de caractères. L'opérateur de troncature est l'astérisque (étoile). Par exemple ado* retrouve ado, adolescent, ados... . Cette opération donne parfois des résultats inattendus. Par exemple, ado* retrouve également adobe, adoration, adouber ...
On dirait que la recherche fonctionne de cette manière alors que je ne précise rien
Effectivement, le système ajoute automatiquement l'opérateur * à chaque terme de recherche. Trop d'utilisateurs oublient de l'utiliser.
Peut-on retrouver des variantes d'un mot avec un même terme de recherche ?
Oui, il suffit d'introduire le radical du mot recherché et le système retrouve tous les mot dérivés car il ajoute automatiquement à chaque terme de recherche une étoile appelée opérateur de troncature
Faut-il respecter la distinction majuscule/minuscule
Non, le système ne fait pas de différence entre les deux graphies.
Faut-il respecter les caractères accentués ?
Non, le système ne distingue pas les signes diacritiques. Réalité = realite
Qu'est-ce qu'un mot d'arrêt ?

Certains mots grammaticaux ou très fréquents ne sont pas repris dans l'index et ne peuvent pas être recherchés. Ils sont appelés mots d'arrêt (ang. stop words). Parmi ceux-ci, on trouve l'article défini anglais the. Comme le système fonctionne en graphie pauvre sans distinction de caractères accentués ou non, le mot thé est éliminé de la recherche.

L'ivresse du thé : The Taste of Tea de Katsuhito Ishii

Pour une liste complète des mots d'arrêt, cliquez ici

Je n'obtiens pas de résultat. Que faire ?

La première chose à faire est de vérifier que l'on a bien orthographié le terme de recherche.

J'obtiens des résultats bizarres. Que faire ?

Tout d'abord, il faut bien comprendre qu'il n'y a aucun critère de sélection grammaticale ou sémantique. En recherchant le signe EU de European Union, on recherche également le participe passé du verbe avoir.

A guide to VAT in the EU of 27 countries

La guerre des mondes n'a pas eu lieu / Pierre Lagrange

Il est donc possible de rechercher des mots grammaticaux comme des adverbes ou des pronoms ou d'autres mots peu significatifs.

Par exemple, dans le titre Le patrimoine est affaire d'histoire, d'identité, d'esthétique, au moins autant que d'économie, les mots affaire, moins et autant peuvent être recherchés au même titre que patrimoine, histoire, esthétique

Quels sont les opérateurs de recherche ?
  • Realite retrouve Réalité et aussi réalité. Il n'y pas de distinction entre majuscules et minuscules ni entre caractères accentués et non accentués.
  • ado retrouve uniquement ado.
  • ado* retrouve aussi adobe, adolescence, adolescent, adolescentes. L'opérateur de troncature * se substitue à n'importe quelle chaîne de caractères. Cet opérateur est ajouté automatiquement. Attention aux mauvaises surprises : la recherche de echo pour retrouver le journal l'Echo retrouve également échouer, échouent car l'opérateur est ajouté automatiquement.
  • realite virtuelle retrouve les notices qui contiennent un des deux termes ou les deux. On trouvera par exemple identité virtuelle ou realité sociale.
  • +toxico* +enceinte : l'opérateur + indique que le terme est obligatoirement présent. Attention, les deux termes peuvent être distants, ce qui peut donner à la phrase un sens différent. Cet opérateur est ajouté automatiquement.
  • +handicap* -menta* l'opérateur - indique que le terme est obligatoirement absent. ATTENTION : si le terme de recherche contient un trait d'union, par exemple e-business ou e-commerce, enfermez ce terme entre guillemets : "e-commerce". Pour retrouver des notices sur les jeux mais pas les jeux d'intérieur ou les jeux videos : +jeu* -interieur* -video* -jeun*. Comme jeu* retrouve jeux mais aussi jeune, jeunes, jeunesse, on ajoute -jeun*
  • "accompagnement social" l'expression entre guillemets doit être présente littéralement. Pour retrouver des documents sur l'e-commerce et le luxe : +"e-commerce" +luxe