c入门13--文件

入门, 文件

c入门13--文件
C文件概述
所谓“文件”是指一组相关数据的有序集合。这个数据集有一个名称，叫做文件名。实际上在前面的各章中我们已经多次使用了文件，例如源程序文件、目标文件、可执行文件、库文件 (头文件)等。
文件通常是驻留在外部介质(如磁盘等)上的，在使用时才调入内存中来。从不同的角度可对文件作不同的分类。从用户的角度看，文件可分为普通文件和设备文件两种。
普通文件是指驻留在磁盘或其它外部介质上的一个有序数据集，可以是源文件、目标文件、可执行程序；也可以是一组待输入处理的原始数据，或者是一组输出的结果。对于源文件、目标文件、可执行程序可以称作程序文件，对输入输出数据可称作数据文件。
设备文件是指与主机相联的各种外部设备，如显示器、打印机、键盘等。在操作系统中，把外部设备也看作是一个文件来进行管理，把它们的输入、输出等同于对磁盘文件的读和写。
通常把显示器定义为标准输出文件，一般情况下在屏幕上显示有关信息就是向标准输出文件输出。如前面经常使用的printf,putchar函数就是这类输出。
键盘通常被指定标准的输入文件，从键盘上输入就意味着从标准输入文件上输入数据。scanf,getchar函数就属于这类输入。
从文件编码的方式来看，文件可分为ASCII码文件和二进制码文件两种。ASCII文件也称为文本文件，这种文件在磁盘中存放时每个字符对应一个字节，用于存放对应的ASCII码。
例如，数5678的存储形式为：
ASCII码：       00110101  00110110  00110111  00111000
               ↓       ↓       ↓       ↓
十进制码：       5       6       7       8
共占用4个字节。
ASCII码文件可在屏幕上按字符显示，例如源程序文件就是ASCII文件，用DOS命令TYPE可显示文件的内容。由于是按字符显示，因此能读懂文件内容。
二进制文件是按二进制的编码方式来存放文件的。
例如，数5678的存储形式为：
00010110  00101110
只占二个字节。二进制文件虽然也可在屏幕上显示，但其内容无法读懂。C系统在处理这些文件时，并不区分类型，都看成是字符流，按字节进行处理。
输入输出字符流的开始和结束只由程序控制而不受物理符号(如回车符)的控制。因此也把这种文件称作“流式文件”。
文件指13.3       针
在Ｃ语言中用一个指针变量指向一个文件，这个指针称为文件指针。通过文件指针就可对它所指的文件进行各种操作。
定义说明文件指针的一般形式为：
FILE *指针变量标识符；
其中FILE应为大写，它实际上是由系统定义的一个结构，该结构中含有文件名、文件状态和文件当前位置等信息。在编写源程序时不必关心FILE结构的细节。
例如：
FILE *fp；
表示fp是指向FILE结构的指针变量，通过fp即可找存放某个文件信息的结构变量，然后按结构变量提供的信息找到该文件，实施对文件的操作。习惯上也笼统地把fp称为指向一个文件的指针。

      文件的打开与关闭
文件在进行读写操作之前要先打开，使用完毕要关闭。所谓打开文件，实际上是建立文件的各种有关信息，并使文件指针指向该文件，以便进行其它操作。关闭文件则断开指针与文件之间的联系，也就禁止再对该文件进行操作。
在Ｃ语言中，文件操作都是由库函数来完成的。在本章内将介绍主要的文件操作函数。
      文件的打开(fopen函数)
fopen函数用来打开一个文件，其调用的一般形式为：
文件指针名=fopen(文件名,使用文件方式);
其中，
“文件指针名”必须是被说明为FILE 类型的指针变量；
“文件名”是被打开文件的文件名；
“使用文件方式”是指文件的类型和操作要求。
“文件名”是字符串常量或字符串数组。
例如：
FILE *fp；
fp=("file a","r");
其意义是在当前目录下打开文件file a，只允许进行“读”操作，并使fp指向该文件。
又如：
FILE *fphzk
fphzk=("c:\\hzk16","rb")
其意义是打开C驱动器磁盘的根目录下的文件hzk16，这是一个二进制文件，只允许按二进制方式进行读操作。两个反斜线“\\ ”中的第一个表示转义字符，第二个表示根目录。

对于文件使用方式有以下几点说明：
文件使用方式由r,w,a,t,b，+六个字符拼成，各字符的含义是：
r(read):       读
w(write):    写
a(append):    追加
t(text):       文本文件，可省略不写
b(banary):    二进制文件
+:             读和写
凡用“r”打开一个文件时，该文件必须已经存在，且只能从该文件读出。
用“w”打开的文件只能向该文件写入。若打开的文件不存在，则以指定的文件名建立该文件，若打开的文件已经存在，则将该文件删去，重建一个新文件。
若要向一个已存在的文件追加新的信息，只能用“a”方式打开文件。但此时该文件必须是存在的，否则将会出错。
在打开一个文件时，如果出错，fopen将返回一个空指针值NULL。在程序中可以用这一信息来判别是否完成打开文件的工作，并作相应的处理。因此常用以下程序段打开文件：
if((fp=fopen("c:\\hzk16","rb")==NULL)

      {
      printf("\nerror on open c:\\hzk16 file!");
      getch();
      exit(1);
}
这段程序的意义是，如果返回的指针为空，表示不能打开C盘根目录下的hzk16文件，则给出提示信息“error on open c:\ hzk16 file!”，下一行getch()的功能是从键盘输入一个字符，但不在屏幕上显示。在这里，该行的作用是等待，只有当用户从键盘敲任一键时，程序才继续执行，因此用户可利用这个等待时间阅读出错提示。敲键后执行exit(1)退出程序。
把一个文本文件读入内存时，要将ASCII码转换成二进制码，而把文件以文本方式写入磁盘时，也要把二进制码转换成ASCII码，因此文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。
标准输入文件(键盘)，标准输出文件(显示器)，标准出错输出(出错信息)是由系统打开的，可直接使用。

文件关闭函数（fclose函数）
文件一旦使用完毕，应用关闭文件函数把文件关闭，以避免文件的数据丢失等错误。
fclose函数调用的一般形式是：
      fclose(文件指针)；
例如：
         fclose(fp);
正常完成关闭文件操作时，fclose函数返回值为0。如返回非零值则表示有错误发生。

文件的读写
对文件的读和写是最常用的文件操作。在Ｃ语言中提供了多种文件读写的函数：
·字符读写函数  ：fgetc和fputc
·字符串读写函数：fgets和fputs
·数据块读写函数：freed和fwrite
·格式化读写函数：fscanf和fprinf
下面分别予以介绍。使用以上函数都要求包含头文件stdio.h。

字符读写函数fgetc和fputc
字符读写函数是以字符(字节)为单位的读写函数。每次可从文件读出或向文件写入一个字符。
读字符函数fgetc
fgetc函数的功能是从指定的文件中读一个字符，函数调用的形式为：
字符变量=fgetc(文件指针)；
例如：
      ch=fgetc(fp);
其意义是从打开的文件fp中读取一个字符并送入ch中。
对于fgetc函数的使用有以下几点说明：
在fgetc函数调用中，读取的文件必须是以读或读写方式打开的。
读取字符的结果也可以不向字符变量赋值，
例如：
fgetc(fp);
但是读出的字符不能保存。
在文件内部有一个位置指针。用来指向文件的当前读写字节。在文件打开时，该指针总是指向文件的第一个字节。使用fgetc 函数后，该位置指针将向后移动一个字节。因此可连续多次使用fgetc函数，读取多个字符。应注意文件指针和文件内部的位置指针不是一回事。文件指针是指向整个文件的，须在程序中定义说明，只要不重新赋值，文件指针的值是不变的。文件内部的位置指针用以指示文件内部的当前读写位置，每读写一次，该指针均向后移动，它不需在程序中定义说明，而是由系统自动设置的。

读入文件c1.doc，在屏幕上输出。
#include<stdio.h>
main()
{
  FILE *fp;
  char ch;
  if((fp=fopen("d:\\jrzh\\example\\c1.txt","rt"))==NULL)
{
printf("\nCannot open file strike any key exit!");
getch();
exit(1);
}
  ch=fgetc(fp);
  while(ch!=EOF)
  {
putchar(ch);
ch=fgetc(fp);
  }
  fclose(fp);

写字符函数fputc
fputc函数的功能是把一个字符写入指定的文件中，函数调用的形式为：
fputc(字符量，文件指针)；
其中，待写入的字符量可以是字符常量或变量，例如：
fputc('a',fp);
其意义是把字符a写入fp所指向的文件中。
对于fputc函数的使用也要说明几点：
被写入的文件可以用写、读写、追加方式打开，用写或读写方式打开一个已存在的文件时将清除原有的文件内容，写入字符从文件首开始。如需保留原有文件内容，希望写入的字符以文件末开始存放，必须以追加方式打开文件。被写入的文件若不存在，则创建该文件。
每写入一个字符，文件内部位置指针向后移动一个字节。
fputc函数有一个返回值，如写入成功则返回写入的字符，否则返回一个EOF。可用此来判断写入是否成功。

字符串读写函数fgets和fputs
读字符串函数fgets
函数的功能是从指定的文件中读一个字符串到字符数组中，函数调用的形式为：
fgets(字符数组名,n,文件指针);
其中的n是一个正整数。表示从文件中读出的字符串不超过 n-1个字符。在读入的最后一个字符后加上串结束标志'\0'。
例如：
fgets(str,n,fp);
的意义是从fp所指的文件中读出n-1个字符送入字符数组str中。

写字符串函数fputs
fputs函数的功能是向指定的文件写入一个字符串，其调用形式为：
fputs(字符串,文件指针);
其中字符串可以是字符串常量，也可以是字符数组名，或指针变量，例如：
fputs(“abcd“,fp);
其意义是把字符串“abcd”写入fp所指的文件之中。

数据块读写函数fread和fwtrite
Ｃ语言还提供了用于整块数据的读写函数。可用来读写一组数据，如一个数组元素，一个结构变量的值等。
读数据块函数调用的一般形式为：
fread(buffer,size,count,fp);
写数据块函数调用的一般形式为：
fwrite(buffer,size,count,fp);
其中:
buffer  是一个指针，在fread函数中，它表示存放输入数据的首地址。在fwrite函数中，它表示存放输出数据的首地址。
size 表示数据块的字节数。
count  表示要读写的数据块块数。
fp    表示文件指针。
例如：
fread(fa,4,5,fp);
其意义是从fp所指的文件中，每次读4个字节(一个实数)送入实数组fa中，连续读5次，即读5个实数到fa中。

      格式化读写函数fscanf和fprintf
fscanf函数，fprintf函数与前面使用的scanf和printf 函数的功能相似，都是格式化读写函数。两者的区别在于fscanf函数和fprintf函数的读写对象不是键盘和显示器，而是磁盘文件。
这两个函数的调用格式为：
fscanf(文件指针,格式字符串,输入表列);
fprintf(文件指针,格式字符串,输出表列);
例如：
fscanf(fp,"%d%s",&i,s);
fprintf(fp,"%d%c",j,ch);
用fscanf和fprintf函数也可以完成例10.6的问题。

文件的随机读写
前面介绍的对文件的读写方式都是顺序读写，即读写文件只能从头开始，顺序读写各个数据。但在实际问题中常要求只读写文件中某一指定的部分。为了解决这个问题可移动文件内部的位置指针到需要读写的位置，再进行读写，这种读写称为随机读写。
实现随机读写的关键是要按要求移动位置指针，这称为文件的定位。

文件定位
移动文件内部位置指针的函数主要有两个，即 rewind 函数和fseek函数。
rewind函数前面已多次使用过，其调用形式为：
rewind(文件指针);
它的功能是把文件内部的位置指针移到文件首。
下面主要介绍fseek函数。
fseek函数用来移动文件内部位置指针，其调用形式为：
fseek(文件指针,位移量,起始点);
其中：
“文件指针”指向被移动的文件。
“位移量”表示移动的字节数，要求位移量是long型数据，以便在文件长度大于64KB 时不会出错。当用常量表示位移量时，要求加后缀“L”。
“起始点”表示从何处开始计算位移量，规定的起始点有三种：文件首，当前位置和文件尾。

文件的随机读写
在移动位置指针之后，即可用前面介绍的任一种读写函数进行读写。由于一般是读写一个数据据块，因此常用fread和fwrite函数。
下面用例题来说明文件的随机读写。

#include<stdio.h>
struct stu
{
  char name[10];
  int num;
  int age;
  char addr[15];
}boy,*qq;
main()
{
  FILE *fp;
  char ch;
  int i=1;
  qq=&boy;
  if((fp=fopen("stu_list","rb"))==NULL)
  {
printf("Cannot open file strike any key exit!");
getch();
exit(1);
  }
  rewind(fp);
  fseek(fp,i*sizeof(struct stu),0);
  fread(qq,sizeof(struct stu),1,fp);
  printf("\n\nname\tnumber    age    addr\n");
  printf("%s\t%5d  %7d    %s\n",qq->name,qq->num,qq->age,
      qq->addr);
}

文件stu_list已由例13.6的程序建立，本程序用随机读出的方法读出第二个学生的数据。程序中定义boy为stu类型变量，qq为指向boy的指针。以读二进制文件方式打开文件，程序第22行移动文件位置指针。其中的i值为1，表示从文件头开始，移动一个stu类型的长度，然后再读出的数据即为第二个学生的数据。

文件结束检测函数feof函数
调用格式：
feof(文件指针);
功能：判断文件是否处于文件结束位置，如文件结束，则返回值为1，否则为0。

      读写文件出错检测函数
ferror函数调用格式：
ferror(文件指针);
功能：检查文件在用各种输入输出函数进行读写时是否出错。如ferror返回值为0表示未出错，否则表示有错。

文件出错标13.7.4       志和文件结束标13.7.5       志置0函数
clearerr函数调用格式：
  clearerr(文件指针);
功能：本函数用于清除出错标志和文件结束标志，使它们为0值。

Ｃ库文件
Ｃ系统提供了丰富的系统文件，称为库文件，C的库文件分为两类，一类是扩展名为".h"的文件，称为头文件，在前面的包含命令中我们已多次使用过。在".h"文件中包含了常量定义、类型定义、宏定义、函数原型以及各种编译选择设置等信息。另一类是函数库，包括了各种函数的目标代码，供用户在程序中调用。通常在程序中调用一个库函数时，要在调用之前包含该函数原型所在的".h" 文件。
下面给出Turbo C的全部".h"文件。
Turbo C头文件
n       ALLOC.H    说明内存管理函数(分配、释放等)。
n       ASSERT.H    定义 assert调试宏。
n       BIOS.H    说明调用IBM—PC ROM BIOS子程序的各个函数。
n       CONIO.H    说明调用DOS控制台I/O子程序的各个函数。
n       CTYPE.H    包含有关字符分类及转换的名n       类信息(如 isalpha和toascii等)。
n       DIR.H       包含有关目录和路径的结构、宏定义和函数。
n       DOS.H       定义和说明MSDOS和8086调用的一些常量和函数。
n       ERRON.H    定义错误代码的助记符。
n       FCNTL.H    定义在与open库子程序连接时的符号常量。
n       FLOAT.H    包含有关浮点运算的一些参数和函数。
n       GRAPHICS.H 说明有关图形功能的各个函数，n       图形错误代码的常量定义，n       正对不同n       驱动程序的各种颜色值，n       及函数用到的一些特殊结构。
n       IO.H       包含低级I/O子程序的结构和说明。
n       LIMIT.H    包含各环境参数、编译时间限制、数的范围等信息。
n       MATH.H    说明数学运算函数，n       还定了 HUGE  VAL 宏，n       说明了matherr和matherr子程序用到的特殊结构。
n       MEM.H       说明一些内存操作函数(其中大多数也在STRING.H中说明)。
n       PROCESS.H 说明进程管理的各个函数，n       spawn…和EXEC …函数的结构说明。
n       SETJMP.H    定义longjmp和setjmp函数用到的jmp buf类型，n       说明这两个函数。
n       SHARE.H    定义文件共享函数的参数。
n       SIGNAL.H    定义SIG[ZZ(Z]  [ZZ)]IGN和SIG[ZZ(Z]  [ZZ)]DFL常量，n       说明rajse和signal两个函数。
n       STDARG.H    定义读函数参数表的宏。(如vprintf,vscarf函数)。
n       STDDEF.H    定义一些公共数据类型和宏。
n       STDIO.H    定义Kernighan和Ritchie在Unix System V 中定义的标n       准和扩展的类型和宏。还定义标n       准I/O 预定义流：stdin,stdout和stderr，n       说明 I/O流子程序。
n       STDLIB.H    说明一些常用的子程序：转换子程序、搜索/ 排序子程序等。
n       STRING.H    说明一些串操作和内存操作函数。
n       SYS\STAT.H 定义在打开和创建文件时用到的一些符号常量。
n       SYS\TYPES.H  说明ftime函数和timeb结构。
n       SYS\TIME.H 定义时间的类型time[ZZ(Z]  [ZZ)]t。
n       TIME.H    定义时间转换子程序asctime、localtime和gmtime的结构，n       ctime、 difftime、 gmtime、 localtime和stime用到的类型，n       并提供这些函数的原型。
n       VALUE.H    定义一些重要常量，n       包括依赖于机器硬件的和为与Unix System V相兼容而n       说明的一些常量，n       包括浮点和双精度值的范围。

本章小结
Ｃ系统把文件当作一个“流”，按字节进行处理。
Ｃ文件按编码方式分为二进制文件和ASCII文件。
Ｃ语言中，用文件指针标识文件，当一个文件被打开时，可取得该文件指针。
文件在读写之前必须打开，读写结束必须关闭。
文件可按只读、只写、读写、追加四种操作方式打开，同时还必须指定文件的类型是二进制文件还是文本文件。
文件可按字节，字符串，数据块为单位读写，文件也可按指定的格式进行读写。
文件内部的位置指针可指示当前的读写位置，移动该指针可以对文件实现随机读写。

返回列表

c入门13--文件

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]