Chapitre 6 La gestion
des fichiersLe C offre la possibilité de lire et d'écrire des
données dans un fichier.
Pour des raisons d'efficacité, les accès à un fichier se font par
l'intermédiaire d'une mémoire-tampon (
buffer), ce qui permet de
réduire le nombre d'accès aux périphériques (disque...).
Pour pouvoir manipuler un fichier, un programme a besoin d'un certain nombre
d'informations : l'adresse de l'endroit de la mémoire-tampon où se trouve
le fichier, la position de la tête de lecture, le mode d'accès au fichier
(lecture ou écriture) ...Ces informations sont rassemblées dans une structure
dont le type, FILE *, est défini
dans stdio.h. Un objet de type FILE * est appelé
flot de données(en anglais, stream).
Avant de lire ou d'écrire dans un fichier, on notifie son accès par la commande
fopen. Cette fonction prend
comme argument le nom du fichier, négocie avec le système d'exploitation et
initialise un flot de données, qui sera ensuite utilisé lors de l'écriture ou
de la lecture. Après les traitements, on annule la liaison entre le fichier et
le flot de données grâce à la fonction fclose.
6.1 Ouverture et fermeture d'un fichier6.1.1 La fonction fopenCette fonction, de type FILE*
ouvre un fichier et lui associe un flot de données. Sa syntaxe est :
fopen("
nom-de-fichier","
mode")
La valeur retournée par fopen
est un flot de données. Si l'exécution de cette fonction ne se déroule pas
normalement, la valeur retournée est le pointeur NULL. Il est donc recommandé de toujours tester si la
valeur renvoyée par la fonction fopen
est égale à NULL afin de
détecter les erreurs (lecture d'un fichier inexistant...).
Le premier argument de fopen est
le nom du fichier concerné, fourni sous forme d'une chaîne de caractères. On
préférera définir le nom du fichier par une constante symbolique au moyen de la
directive #define plutôt que
d'expliciter le nom de fichier dans le corps du programme.
Le second argument,
mode,
est une chaîne de caractères qui spécifie le mode d'accès au fichier. Les
spécificateurs de mode d'accès diffèrent suivant le type de fichier considéré.
On distingue
- les fichiers textes,
pour lesquels les caractères de contrôle (retour à la ligne ...) seront
interprétés en tant que tels lors de la lecture et de l'écriture ;
- les fichiers binaires,
pour lesquels les caractères de contrôle se sont pas interprétés.
Les différents modes d'accès
sont les suivants :
"r"
| ouverture d'un fichier texte en lecture
|
"w"
| ouverture d'un fichier texte en écriture
|
"a"
| ouverture d'un fichier texte en écriture à la fin
|
"rb"
| ouverture d'un fichier binaire en lecture
|
"wb"
| ouverture d'un fichier binaire en écriture
|
"ab"
| ouverture d'un fichier binaire en écriture à la fin
|
"r+"
| ouverture d'un fichier texte en lecture/écriture
|
"w+"
| ouverture d'un fichier texte en lecture/écriture
|
"a+"
| ouverture d'un fichier texte en lecture/écriture à la fin
|
"r+b"
| ouverture d'un fichier binaire en lecture/écriture
|
"w+b"
| ouverture d'un fichier binaire en lecture/écriture
|
"a+b"
| ouverture d'un fichier binaire en lecture/écriture à la fin
|
Ces modes d'accès ont pour particularités :
- Si le mode contient la
lettre r, le fichier doit
exister.
- Si le mode contient la
lettre w, le fichier peut ne
pas exister. Dans ce cas, il sera créé. Si le fichier existe déjà, son
ancien contenu sera perdu.
- Si le mode contient la
lettre a, le fichier peut
ne pas exister. Dans ce cas, il sera créé. Si le fichier existe déjà, les
nouvelles données seront ajoutées à la fin du fichier précédent.
Trois flots standard peuvent être utilisés en C sans
qu'il soit nécessaire de les ouvrir ou de les fermer :
- stdin (standard input) : unité d'entrée (par
défaut, le clavier) ;
- stdout (standard output) : unité de sortie (par
défaut, l'écran) ;
- stderr (standard error) : unité d'affichage des
messages d'erreur (par défaut, l'écran).
Il est fortement conseillé d'afficher systématiquement les
messages d'erreur sur stderr
afin que ces messages apparaissent à l'écran même lorsque la sortie standard
est redirigée.
6.1.2 La fonction fcloseElle permet de fermer le flot qui a été associé à un fichier
par la fonction fopen. Sa
syntaxe est :
fclose(
flot)
où
flotest le flot de type FILE*
retourné par la fonction fopen
correspondant.
La fonction fclose retourne un
entier qui vaut zéro si l'opération s'est déroulée normalement (et une valeur
non nulle en cas d'erreur).
6.2 Les entrées-sorties formatées6.2.1 La fonction d'écriture fprintfLa fonction fprintf,
analogue à printf, permet
d'écrire des données dans un fichier. Sa syntaxe est
fprintf(
flot,"
chaîne de contrôle",
expression-1, ...,
expression-n)
où
flotest le flot de données retourné par la fonction fopen. Les spécifications de format utilisées pour la
fonction fprintf sont les mêmes
que pour printf.
6.2.2 La fonction de saisie fscanfLa fonction fscanf,
analogue à scanf, permet de lire
des données dans un fichier. Sa syntaxe est semblable à celle de scanf :
fscanf(
flot,"
chaîne de contrôle",
argument-1,...,
argument-n)
où
flotest le flot de données retourné par fopen.
Les spécifications de format sont ici les mêmes que celles de la fonction scanf.
6.3 Impression et lecture de caractèresSimilaires aux fonctions getchar
et retirer ce mot, les fonctions fgetc et fputc
permettent respectivement de lire et d'écrire un caractère dans un fichier. La
fonction fgetc, de type int, retourne le caractère lu dans le
fichier. Elle retourne la constante EOF
lorsqu'elle détecte la fin du fichier. Son prototype est
int fgetc(FILE*
flot);
où
flotest le flot de type FILE*
retourné par la fonction fopen.
Comme pour la fonction getchar,
il est conseillé de déclarer de type int
la variable destinée à recevoir la valeur de retour de fgetc pour pouvoir détecter correctement
la fin de fichier.
La fonction fputc écrit
caractere dans
le flot de données :
int fputc(int
caractere, FILE *
flot)
Elle retourne l'entier correspondant au caractère lu (ou la
constante EOF en cas d'erreur).
Il existe également deux versions optimisées des fonctions fgetc et fputc
qui sont implémentées par des macros. Il s'agit respectivement de getc et retirer ce mot.
Leur syntaxe est similaire à celle de fgetc
et fputc :
int getc(FILE*
flot);
int retirer ce mot(int caractere,
FILE *flot)Ainsi, le programme suivant lit le contenu du fichier texte entree, et le recopie caractère par
caractère dans le fichier sortie :
#include #include #define ENTREE "entree.txt"#define SORTIE "sortie.txt" int main(void){ FILE *f_in, *f_out; int c; if ((f_in = fopen(ENTREE,"r")) == NULL) { fprintf(stderr, "\nErreur: Impossible de lire le fichier %s\n",ENTREE); return(EXIT_FAILURE); } if ((f_out = fopen(SORTIE,"w")) == NULL) { fprintf(stderr, "\nErreur: Impossible d'ecrire dans le fichier %s\n", \SORTIE); return(EXIT_FAILURE); } while ((c = fgetc(f_in)) != EOF) fputc(c, f_out); fclose(f_in); fclose(f_out); return(EXIT_SUCCESS);}
6.4 Relecture d'un caractèreIl est possible de replacer un caractère dans un flot au
moyen de la fonction ungetc :
int ungetc(int
caractere, FILE *
flot);
Cette fonction place le caractère
caractere(converti en unsigned char) dans
le flot
flot.
En particulier, si
caractereest égal au dernier caractère lu dans le flot, elle annule le déplacement
provoqué par la lecture précédente. Toutefois, ungetc
peut être utilisée avec n'importe quel caractère (sauf EOF). Par exemple, l'exécution du
programme suivant
#include #include #define ENTREE "entree.txt" int main(void){ FILE *f_in; int c; if ((f_in = fopen(ENTREE,"r")) == NULL) { fprintf(stderr, "\nErreur: Impossible de lire le fichier %s\n",ENTREE); return(EXIT_FAILURE); } while ((c = fgetc(f_in)) != EOF) { if (c == '0') ungetc('.',f_in); retirer ce mot(c); } fclose(f_in); return(EXIT_SUCCESS);}
sur le fichier entree.txt
dont le contenu est 097023
affiche à l'écran 0.970.23
6.5 Les entrées-sorties binairesLes fonctions d'entrées-sorties binaires permettent de
transférer des données dans un fichier sans transcodage. Elles sont donc plus
efficaces que les fonctions d'entrée-sortie standard, mais les fichiers
produits ne sont pas portables puisque le codage des données dépend des
machines.
Elles sont notamment utiles pour manipuler des données de grande taille ou
ayant un type composé. Leurs prototypes sont :
size_t fread(void *
pointeur, size_t
taille,
size_t
nombre, FILE *
flot);
size_t fwrite(void *pointeur,
size_t taille,
size_t nombre,
FILE *flot); où
pointeurest l'adresse du début des données à transférer,
taille la taille des objets à
transférer,
nombreleur nombre. Rappelons que le type size_t,
défini dans stddef.h, correspond
au type du résultat de l'évaluation de sizeof.
Il s'agit du plus grand type entier non signé.
La fonction fread lit les
données sur le flot
flotet la fonction fwrite les écrit.
Elles retournent toutes deux le nombre de données transférées.
Par exemple, le programme suivant écrit un tableau d'entiers (contenant les
50 premiers entiers) avec fwrite
dans le fichier sortie, puis lit
ce fichier avec fread et imprime
les éléments du tableau.
#include #include #define NB 50#define F_SORTIE "sortie" int main(void){ FILE *f_in, *f_out; int *tab1, *tab2; int i; tab1 = (int*)malloc(NB * sizeof(int)); tab2 = (int*)malloc(NB * sizeof(int)); for (i = 0 ; i < NB; i++) tab1
= i; /* ecriture du tableau dans F_SORTIE */ if ((f_out = fopen(F_SORTIE, "w")) == NULL) { fprintf(stderr, "\nImpossible d'ecrire dans le fichier %s\n",F_SORTIE); return(EXIT_FAILURE); } fwrite(tab1, NB * sizeof(int), 1, f_out); fclose(f_out); /* lecture dans F_SORTIE */ if ((f_in = fopen(F_SORTIE, "r")) == NULL) { fprintf(stderr, "\nImpossible de lire dans le fichier %s\n",F_SORTIE); return(EXIT_FAILURE); } fread(tab2, NB * sizeof(int), 1, f_in); fclose(f_in); for (i = 0 ; i < NB; i++) printf("%d\t",tab2[i]); printf("\n"); return(EXIT_SUCCESS);}
Les éléments du tableau sont bien affichés à l'écran. Par
contre, on constate que le contenu du fichier sortie
n'est pas encodé.
6.6 Positionnement dans un fichier
Les différentes fonctions d'entrées-sorties permettent
d'accéder à un fichier en [i]mode séquentiel : les données du fichier
sont lues ou écrites les unes à la suite des autres. Il est également possible
d'accéder à un fichier en
mode direct, c'est-à-dire que l'on peut se
positionner à n'importe quel endroit du fichier. La fonction fseek permet de se positionner à un
endroit précis ; elle a pour prototype :
int fseek(FILE *
flot, long
deplacement, int
origine);
La variable
deplacement détermine la nouvelle position dans le
fichier. Il s'agit d'un déplacement relatif par rapport à l'origine ; il
est compté en nombre d'octets. La variable
origine peut prendre trois
valeurs :
- SEEK_SET (égale à 0) : début du
fichier ;
- SEEK_CUR (égale à 1) : position
courante ;
- SEEK_END (égale à 2) : fin du fichier.
La fonction
int rewind(FILE *
flot);
permet de se positionner au début du fichier. Elle est
équivalente à
fseek(
flot, 0, SEEK_SET);
La fonction
long ftell(FILE *
flot);
retourne la position courante dans le fichier (en nombre
d'octets depuis l'origine).
Par exemple
#include #include #define NB 50#define F_SORTIE "sortie" int main(void){ FILE *f_in, *f_out; int *tab; int i; tab = (int*)malloc(NB * sizeof(int)); for (i = 0 ; i < NB; i++) tab[i] = i; /* ecriture du tableau dans F_SORTIE */ if ((f_out = fopen(F_SORTIE, "w")) == NULL) { fprintf(stderr, "\nImpossible d'ecrire dans le fichier %s\n",F_SORTIE); return(EXIT_FAILURE); } fwrite(tab, NB * sizeof(int), 1, f_out); fclose(f_out); /* lecture dans F_SORTIE */ if ((f_in = fopen(F_SORTIE, "r")) == NULL) { fprintf(stderr, "\nImpossible de lire dans le fichier %s\n",F_SORTIE); return(EXIT_FAILURE); } /* on se positionne a la fin du fichier */ fseek(f_in, 0, SEEK_END); printf("\n position %ld", ftell(f_in)); /* deplacement de 10 int en arriere */ fseek(f_in, -10 * sizeof(int), SEEK_END); printf("\n position %ld", ftell(f_in)); fread(&i, sizeof(i), 1, f_in); printf("\t i = %d", i); /* retour au debut du fichier */ rewind(f_in); printf("\n position %ld", ftell(f_in)); fread(&i, sizeof(i), 1, f_in); printf("\t i = %d", i); /* deplacement de 5 int en avant */ fseek(f_in, 5 * sizeof(int), SEEK_CUR); printf("\n position %ld", ftell(f_in)); fread(&i, sizeof(i), 1, f_in); printf("\t i = %d\n", i); fclose(f_in); return(EXIT_SUCCESS);}
L'exécution de ce programme affiche à l'écran :
position 200 position 160 i = 40 position 0 i = 0 position 24 i = 6
On constate en particulier que l'emploi de la fonction fread provoque un déplacement
correspondant à la taille de l'objet lu à partir de la position courante.