Les bases de données

Plan :


1. Les bases de données
2. Accès en ligne à une base de données
2.1 L’accès local à une base de données
2.2 L’accès à distance à une base de données
2.2.1Les réseaux :
2.2.1.1Un producteur de notices,
2.2.1.1Un serveur,
2.2.1.3des usagers éloignés
2.2.1.1Et des câbles !
2.2.2Internet
3. Les bases de données sur cédéroms
4. La recherche dans une base de données.

Navigation sur le site

Cours :

1. Les bases de données


On appelle base de données, un ensemble de références bibliographiques conservées et gérées par des moyens informatisés.
Elles sont l’équivalent informatisé des répertoires bibliographiques.
Le catalogue informatisé de la Médiathèque A. Malraux de Tourcoing est une base de données.
On appelle banque de données, un ensemble organisé de références conservées et gérées par des moyens informatiques, les références n’étant pas forcement des réf. bibliographiques.
Les banques de données sont l’équivalent informatisé des ouvrages de références. L’annuaire électronique par le 3611, le Grand Robert de la langue française sur cédérom sont des banques de données.
L’informatique aurait pu être inventée pour les besoins des bibliothèques. Les catalogues et bibliographies représentent de grosses masses d'information. Les notices peuvent être nombreuses et les accès multiples à chacune de ces notices. Les avantages de l’informatisation des notices bibliographiques sont importants pour les usagers :
 La consultation d'une base de données est rapide, la base de données est à jour, la recherche est puissante (recherche mot clé sur des index volumineux) voire facile (mais ça dépend du logiciel d'interrogation). Elle peut être délocalisée grâce aux réseaux. 

Voir : une présentation des principales bases spécialisées et de quelques bases générales par l'URFIST de Strasbourg,
http://www-scd-ulp.u-strasbg.fr/urfist/IST_bdd/initiation_bdd.html

2. Accès en ligne à une base de données

 

2.1 L’accès local à une base de données


Soit une bibliothèque informatisée.
Elle est équipée d’un ordinateur important auquel sont connectés 50 ordinateurs moins puissants. Les liens entre les ordinateurs sont des cables locaux (dans les murs du bâtiment). Tous les ordinateurs sont connectés à l’ordinateur qui contient la base de données sur son disque dur.
Certains ordinateurs  sont utilisés par les usagers dans les espaces publics : ils consultent la base grâce à un logiciel de recherche
D’autres, eux aussi connectés à l’ordinateur qui contient la base de données sont utilisés par les professionnels producteurs de notices : ils mettent la base à jour continûment : elle est immédiatement accessible dans l’état par les usagers.

2.2 L’accès à distance à une base de données

2.2.1 Les réseaux :


Pour une base de données accessible à distance, l’organisation est alors la suivante :

2.2.1.1 Un producteur de notices,


Un producteur de notices, par exemple, une bibliothèque.
Il s’agit de produire les notices avec un logiciel de saisie de notices. C’est le producteur qui en général choisit les descripteurs qui alimenteront les listes autorités et thésaurii. Ce sont des listes de mots autorisés parmi lesquels les usagers chercheront à l’aide de logiciels de recherche.

2.2.1.2 Un serveur.


Les notices sont stockées sur le disque d’un ordinateur puissant, le serveur (c’est le nom de l’ordinateur puissant qui stocke et distribue les informations contenues dans la base).
C’est aussi le nom de l’organisme prestataire de service qui possède et gère cet ordinateur puissant. Il stocke donc la base de données produite par le producteur sur un ordinateur puissant. La base de données est interrogeable grâce à un logiciel d’interrogation. Les résultats de recherches peuvent être déchargés dans certains cas. Le serveur peut accueillir et gérer plusieurs bases de données de plusieurs producteurs différents. Le serveur ne fait pas qu'additionner les bases les unes aux autres, il permet aussi de gérer des choses communes de façon unifiée quelque soit le logiciel de chaque utilisateur, par exemple la recherche documentaire par un logiciel unique. L’ordinateur du serveur peut être accessible par minitel , par internet ou par un réseau spécialisé .
Le serveur se fait payer par le producteur et par les usagers auxquels il rend ses services.
Souvent, le producteur de notices est son propre serveur : il possède un gros ordinateur, il s’occuppe lui même de rendre ses notices accessibles aux usagers éloignés.

2.2.1.3 Des usagers éloignés


Ils sont équipés de :
-terminaux domestiques de type minitel connectés au réseau public des télécommunication si la base de données est accessible par minitel
-d’ordinateurs domestiques de type PC ou Mac directement connectés au réseau des télécommunication (les usagers peuvent être chez eux)
-de micros-ordinateurs connectés à un plus gros ordinateur qui lui est connecté au réseau des télécommunications.
Le télé déchargement de notices pour les récupérer et l’impression peuvent être autorisées 
Les usagers payent l’utilisation du serveur, l’utilisation du réseau matériel de cables qui transporte les informations (France télécom par exemple), éventuellement les notices déchargées.

2.2.1.4Des cables


Les informations électroniques circulent dans des cables qui sont installés par les télécoms sous les trottoirs (réseau téléphonique, Transpac, réseau spécialisé).
L’utilisation des cables est payante : l’opérateur public est payé soit par l’usager (cas du minitel), soit par le serveur (qui répercute sur l’usager final ou l’organisme)
Hors les murs, les cables peuvent être remplacés par des paraboles et satellites, la circulation des informations étant moins matérialisée

2.2.2 Internet


Les réseaux peuvent être eux même en réseau. Internet permet la connexion de réseaux utilisant le même protocole d’accès. En fait, il s’agit de serveurs (qui représentent chacun des réseaux) qui sont liés entre eux.
Le web qui est la partie attractive d’Internet fédère des ordinateurs qui diffusent de l’information codée en langage hypertexte avec des liens entre des images, du son et du texte
L’organisation vue plus haut pour les réseaux est valable pour internet, mais il faut aussi
-un fournisseur d’accès à Internet : les usagers particuliers s’adressent à des entreprises commerciales comme  Wanadoo de France Télécom. Les fournisseurs d’accès pour les bases de données sont plutôt des organismes comme des universités, des institutions de recherche ou de documentation. En fait il faut être connecté à un serveur qui soit lui même déjà sur le réseau.
-du coté de l’utilisateur, il faut que son micro soit équipé d’un navigateur  comme Netscape ou Internet explorer
-et sauf si on la connaît, il faut savoir retrouver l’ adresse électronique de la base de données que l’on veut consulter grâce à un répertoire ou à un moteur de recherche comme Yahoo, Alta vista ou Nomade

3. Les bases de données sur cédéroms


Un cédérom est un produit électronique de l’édition commerciale, en multiples exemplaires qui sont vendus. Leur grande capacité de stockage les rend adaptés à la copie de bases de données volumineuses.
La consultation en ligne vue plus haut nécessite l’accès à un réseau de télécommunication : le réseau téléphonique pour le minitel, des réseaux spécialisés pour certaines bases de données, éventuellement internet.
Par contre, un cédérom peut être consulté sur un ordinateur local tout seul dans son coin, équipé d’un lecteur de cédérom.
Il présente des avantages et des inconvénients :
Pour le déchargement de notices, il n’est plus nécessaire de les faire voyager dans les cables, ou via des satellites et paraboles à travers tous les pays, d’où une économie appréciable sur le prix à payer à l’opérateur télécomm.
On peut prendre son temps pour chercher car il n’y a pas de facturation ni de l’opérateur télécomm (qui fournit les cables), ni du serveur qui facture (parfois cher) la connexion à son ordinateur.
Simplicité d’utilisation
Installation en réseau local possible. Ex les cédéroms consultables dans une bibliothèque sont souvent dans une "tour" (dans un bureau) et accessibles de tous les micros mis à la disposition des usagers.
Inconvénient : la base de données est copiée sur cédéroms régulièrement, tous les mois, trimestres, ans... mais entre deux on n’a pas accès aux mises à jour : pas les nouvelles notices (l’accroissement), ni les corrections. En ligne, on avait accès à la base réelle.

4. La recherche dans une base de données.


Les informations ne sont pas classées mais stockées en tas dans la mémoire. Il faut des chemins pour y accéder.
La façon dont se passe la recherche est liée à la saisie des notices.
Les éléments de la notice sont saisis dans des champs et sous champs. Ces éléments décrivent le document primaire lui même ou sont des descripteurs contrôlés par un fichier autorité ou un thésaurus pour les vedettes ou points d’accès.

Ex : on saisit la  référence de Paradis  de Toni Morrison. Le titre Paradis est saisi dans un champ appelé "200$a" et la vedette auteur elle dans des champs appelés "700$a" et "700$b".
Il existe un index qui est alimenté par tout ce que contiennent tous les champs 700$a, cet index est interrogeable : un usager peut chercher Morrison dans cet index par un chemin alphabétique, trouver une réponse positive et afficher toute les notices liées à cet auteur dont Paradis
Chaque notice est ainsi répartie en champs sur lesquels le producteur de notice a prévu ou non des chemins d’accès. 
Le chemin titres ira vérifier l'index constitué de tous les contenus des champs 200$a où sont saisis les titres..etc.
La recherche par mot clé permet de rechercher un ou plusieurs mots dans une notice ou dans un champ particulier.
Ainsi, on peut chercher le mot « Gallimard »
-n’importe où dans une notice, on aura par ex. 3000 réponses
-ou seulement dans le champ des titres, on aura 1 réponse : la biographie de Gaston Gallimard.
Les opérateurs booléens permettent des recherches avec des relations entre descripteurs :
-informatique et France
-Informatique ou France
-Informatique sauf France

La troncature (souvent *)permet de retrouver des mots commençant par le même groupe de lettres :
prune*
trouve : prune, prunes, pruneau, prunelle, prunelier...etc.
Certains logiciels d’interrogation nécessitent une formation : les instructions à donner pour communiquer avec l’ordinateur peuvent être complexes. Ex simple : la troncature peut être *, / ou autre chose qu’on ne peut deviner.

Voir : des cours sur l'interrogation des bases de données :

-par S. Fayet, du SCD de Paris 4,
http://perso.wanadoo.fr/catiweb/fayet/interroger.htm#début

-par l'Urfist de Strasbourg,
http://www-scd-ulp.u-strasbg.fr/urfist/IST_bdd/interbdd.htm
 

Haut de la page | Cours suivant
Les bases de données | Introduction | Menu | Plan du site | Index | Accueil