需要理解的知识点包括:数据流、缓冲区、文件类型、文件存取方式

1.1 数据流:

指程序与数据的交互是以流的形式进行的.进行C语言文件的存取时,都会先进行“打开文件”操作,这个操作就是在打开数据流,而“关闭文件”操作就是关闭数据流

1.2 缓冲区(Buffer):

指在程序执行时,所提供的额外内存,可用来暂时存放做准备执行的数据.它的设置是为了提高存取效率,因为内存的存取速度比磁盘驱动器快得多.
C++ 语言中带缓冲区的文件处理:
C++ 语言的文件处理功能依据系统是否设置“缓冲区”分为两种:

  • 一种是设置缓冲区
  • 另一种是不设置缓冲区
  • 由于不设置缓冲区的文件处理方式,必须使用较低级的I/O函数(包含在头文件io.h和fcntl.h中)来直接对磁盘存取,这种方式的存取速度慢,并且由于不是 C++ 的标准函数,跨平台操作时容易出问题.下面只介绍第一种处理方式,即设置缓冲区的文件处理方式:
    当使用标准 I/O 函数(包含在头文件 cstdio 中)时,系统会自动设置缓冲区,并通过数据流来读写文件.
    当进 行文件读取时,不会直接对磁盘进行读取,而是先打开数据流,将磁盘上的文件信息拷贝到缓冲区内,然后程序再从缓冲区中读取所需数据 ,如下图所示:

    事实上,当 写入文件时,并不会马上写入磁盘中,而是先写入缓冲区,只有在缓冲区已满或“关闭文件”时,才会将数据写入磁盘 ,如下图所示.

    1.3 文件类型:

    分为 文本文件 二进制文件 两种.

  • 文本文件: 是以字符编码的方式进行保存的,只是计算机以二进制表示数据在外部存储介质上的另一种存放形式.它所存放的每一个字节都可以转换为一个可读字符当向文件中写入数据时,一旦遇到"换行"字符(ASCII 码为10)则会转换成"回车-换行"(ASCII 值为13,10).在读取数据的时候,一遇到"回车-换行"的组合 ASCII 值为13,10),则会转换成为"换行"字符(ASCII 码为10)
  • 二进制文: 件将内存中数据原封不动的读取和写入文件中
  • 二进制文件适用于非字符为主的数据.如果以记事本打开,只会看到一堆乱码.
    当按照文本方式其实, 除了文本文件外,所有的数据都可以算是二进制文件 . 二进制文件的优点 在于 存取速度快,占用空间小,以及可随机存取数据 .
    在文件操作中因为文本打开方式和二进制文件打开方式会导致数据读取和写入换行时候的不同所以在进行文件操作时候要注意 写入和读取的方式要保持一致 ,如果采用文本方式写入,应该采用文本方式读取,如果采用二进制方式写入,就应该用二进制方式读取, 但是不管是文本文件还是二进制文件,如果采用统一的二进制方式写入和读取数据都是不会出错的 ,不管是文本文件还是二进制文件,都可以采用二进制方式或者文本方式打开,然后进行写入或读取.但是对于二进制文件来说,如果以文本凡是读取数据时候可能会出现一些问题

    1.4 文件存取方式:

    包括 顺序存取方式 随机存取方式 两种.

  • 顺序读取 也就是从上往下,一笔一笔读取文件的内容.保存数据时,将数据附加在文件的末尾.这种存取方式常用于文本文件,而被存取的文件则称为顺序文件.
  • 随机存取方式 多半以二进制文件为主.它会以一个完整的单位来进行数据的读取和写入,通常以结构为单位.
  • 1.5 借助文件指针读写文件

    我们如果要访问文件,要借助于文本变量,即文件指针才可以完成
    文件在进行读写操作之前要先打开,使用完毕要关闭.所谓打开文件,实际上是建立文件的各种有关信息,并使文件指针指向该文件,以便进行其它操作.关闭文件则断开指针与文件之间的联系,也就禁止再对该文件进行操作.

    1.6 操作流图

    [返回目录]

    文件操作主要函数

    [ 文件打开与关闭 ][ 文件的读写 ][ 文件的缓冲区操作 ][ 文件的其他操作 ]

    2.1.1 fopen(打开文件)

    头文件: #include<cstdio>

    函数声明: FILE * fopen(const char * path,const char * mode);

  • path字符串 包含欲打开的文件路径及文件名如果没有指定文件路径,则默认为当前工作目录
  • mode字符串
  • 使用方式 具体含义
    “rt” 只读打开一个文本文件,只允许读数据
    “wt” 只写打开或建立一个文本文件,只允许写数据
    “at” 追加打开一个文本文件,并在文件末尾写数据
    “rb” 只读打开一个二进制文件,只允许读数据
    “wb” 只写打开或建立一个二进制文件,只允许写数据
    “ab” 追加打开一个二进制文件,并在文件末尾写数据
    “rt+” 读写打开一个文本文件,允许读和写
    “wt+” 读写打开或建立一个文本文件,允许读写
    “at+” 读写打开一个文本文件,允许读,或在文件末追加数据
    “rb+” 读写打开一个二进制文件,允许读和写
    “wb+” 读写打开或建立一个二进制文件,允许读和写
    “ab+” 读写打开一个二进制文件,允许读,或在文件末追加数据

    文件使用方式由r,w,a,t,b,+六个字符拼成,各字符的含义是:

  • r(read) : 读 (打开只读文件,该文件必须存在)
  • w(write) : 写 (打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失.若文件不存在则建立该文件)
  • a(append) : 追加(以附加的方式打开只写文件.若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留)
  • t(text) : 文本文件,可省略不写
  • b(banary) : 二进制文件
  • + : 可读和写
  • 上述的形态字符串都可以再加一个 b 字符,如 rb、w+b 或 ab+ 等组合,加入 b 字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件.不过在 POSIX 系统,包含 Linux 都会忽略该字符.由 fopen() 所建立的新文件会具有 S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S_IROTH|S_IWOTH (0666) 权限,此文件权限也会参考 umask 值.
  • 使用 fopen() 函数打开的文件会先将文件复制到缓冲区.注意:所下达的读取或写入动作,都是针对缓冲区进行存取而不是磁盘,只有当使用 fclose() 函数关闭文件时,缓冲区中的数据才会写入磁盘 .
  • 返回值: 文件顺利打开后,指向该流的文件指针就会被返回.若果文件打开失败则返回 NULL , 并把错误代码存在 errno 中.(附加说明 一般而言,开文件后会作一些文件读取或写入的动作,若开文件失败,接下来的读写动作也无法顺利进行,所以在 fopen() 后请作错误判断及处理.)

    2.1.2 fclose(关闭文件)

    头文件: #include<cstdio>

    函数声明: int fclose(FILE * stream);

    说明: fclose() 用来关闭先前 fopen() 打开的文件.此动作会让缓冲区内的数据写入文件中,并释放系统所提供的文件资源.

  • 若关文件动作成功则返回 0 ,有错误发生时则返回 EOF 并把错误代码存到 errno.
  • 错误代码 EBADF 表示参数 stream 非已打开的文件.
  • 其意 putc 函数的使用几点说明:
  • 被写入的文件可以用写、读写、追加方式打开,用写或读写方式,写入字符时是从文件首开始的.如需保留原有文件内容,希望写入的字符,被写入的文件若不存在,则创建该文件.
  • 每写入一个字符,文件内部位置指针向后移动一个字节.
  • fputc 函数有一个返回值,如写入成功则返回写入的字符,否则返回一个 EOF .可用此来判断写符,写入一个文件,再把该文件内容读出显示在屏幕上.

  • 返回值: fputc() 会返回写入成功的字符,即参数 c.若返回 EOF 则代表写入失败.

    2.2.3 fgets(由文件中读取一字符串)

    头文件: #include<cstdio>

    函数声明: char * fgets(char * s,int size,FILE * stream);

    说明: fgets() 用来从参数 stream 所指的文件内读入字符并存到参数 s 所指的内存空间,直到出现换行字符、读到文件尾或是已读了size-1个字符为止,最后会加上 NULL 作为字符串结束.

    返回值: gets() 若成功则返回 s 指针,返回 NULL 则表示有错误发生.

    2.2.4 fputs(将一指定的字符串写入文件内)

    头文件: #include<cstdio>

    函数声明: int fputs(const char * s,FILE * stream);

    说明: fputs() 用来将参数 s 所指的字符串写入到参数 stream 所指的文件内.

    返回值: 若成功则返回写出的字符个数,返回 EOF 则表示有错误发生.

    2.2.5 fread(从文件流读取数据)

    头文件: #include<cstdio>

    函数声明 : size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream);

    说明: fread() 用来从文件流中读取数据

  • stream 为已打开的文件指针
  • ptr 指向欲存放读取进来的数据空间,读取的字符数以参数 size*nmemb 来决定.Fread() 会返回实际读取到的 nmemb 数目,如果此值比参数 nmemb 来得小,则代表可能读到了文件尾或有错误发生,这时必须用 feof() 或 ferror() 来决定发生什么情况.
  • 2.2.6 fwrite(将数据写至文件流)

    头文件: #include<cstdio>

    函数声明: size_t fwrite(const void * ptr,size_t size,size_t nmemb,FILE * stream);

  • fwrite() 用来将数据写入文件流中
  • fprintf 和 fscanf 函数的读写对象不是终端(标准输入输出),而是磁盘文件
  • 说明: 它们与 printf 和 scanf 函数相仿,都是格式化读写函数.不同的是:fprintf 和 fscanf 函数的读写对象不是终端(标准输入输出),而是磁盘文件.printf 函数是将内容输出到终端(屏幕),因此,fprintf 就是将内容输出到磁盘文件了

    2.2.8 getc(由文件中读取一个字符)

    头文件: #include<cstdio>

    函数声明: int getc(FILE * stream);

  • getc() 用来从参数 stream 所指的文件中读取一个字符.若读到文件尾而无数据时便返回 EOF
  • getc() 与 fgetc() 作用相同,但 getc() 为宏定义,非真正的函数调用.
  • 返回值: getc() 会返回读取到的字符,若返回 EOF 则表示到了文件尾.

    2.2.9 getchar(由标准输入设备内读进一字符)

    头文件: #include<cstdio>

    函数声明: int getchar(void);

  • getchar() 用来从标准输入设备中读取一个字符.然后将该字符从 unsigned char 转换成 int 后返回
  • getchar() 非真正函数,而是 getc(stdin) 宏定义
  • 头文件: #include<cstdio>

    函数声明: char * gets(char *s);

    说明: gets() 用来从标准设备读入字符并存到参数 s 所指的内存空间,直到出现换行字符或读到文件尾为止,最后加上 NULL 作为字符串结束,由于 gets() 无法知道字符串 s 的大小,必须遇到换行字符或文件尾才会结束输入,因此容易造成缓冲溢出的安全性问题.建议使用 fgets() 取代

    返回值: gets() 若成功则返回 s 指针,返回 NULL 则表示有错误发生.

    2.2.11 putc(将一指定字符写入文件中)

    头文件: #include<cstdio>

    函数声明: int putc(int c,FILE * stream);

  • putc() 会将参数 c 转为 unsigned char 后写入参数 stream 指定的文件中
  • putc() 与 fputc()作用相同,但 putc() 为宏定义,非真正的函数调用.
  • 返回值: putc() 会返回写入成功的字符,即参数 c.若返回 EOF 则代表写入失败.

    2.2.12 putchar(将指定的字符写到标准输出设备)

    头文件: #include<cstdio>

    函数声明: int putchar (int c);

  • putchar() 用来将参数 c 字符写到标准输出设备.
  • putchar() 非真正函数,而是 putc(c,stdout) 宏定义.
  • 返回值: putchar() 会返回输出成功的字符,即参数 c.若返回 EOF 则代表输出失败.

    2.2.13 puts(由标准输入设备内读进一字符串)

    头文件: #include<cstdio>

    函数声明: int puts(char *s);

    说明: 把函数的字符串写到标准输出流 stdout,在输出流中用换行符('\n')替换字符串中的结束符null 字符('\0 ')

    返回值: puts() 若成功则返回正的非零值,返回 EOF 则表示有错误发生.

    2.2.14 ungetc(将指定字符写回文件流中)

    头文件: #include<cstdio>

    函数声明: int ungetc(int c,FILE * stream);

    说明: ungetc() 将参数 c 字符写回参数 stream 所指定的文件流.这个写回的字符会由下一个读取文件流的函数取得.

    返回值: 成功则返回 c 字符,若有错误则返回 EOF.

    [返回子目录]

    2.3 文件的缓冲区操作:

    [ fflush ] [ setbuf ] [ setbuffer ] [ setlinebuf ] [ setvbuf ]

    头文件: #include<cstdio>

    函数声明: int fflush(FILE* stream);

    说明: fflush() 会强迫将缓冲区内的数据写回参数 stream 指定的文件中.如果参数 stream 为 NULL ,fflush() 会将所有打开的文件数据更新.

    返回值: 成功返回 0 ,失败返回 EOF ,错误代码存于errno中.(错误代码: EBADF 参数 stream 指定的文件未被打开,或打开状态为只读)

    2.3.2 setbuf(设置文件流的缓冲区)

    头文件: #include<cstdio>

    函数声明: void setbuf(FILE * stream,char * buf);

    说明: 在打开文件流后,读取内容之前,调用 setbuf() 可以用来设置文件流的缓冲区

  • stream 为指定的文件流
  • buf 指向自定的缓冲区起始地址.如果参数 buf 为 NULL 指针,则为无缓冲 IO .Setbuf() 相当于调用 setvbuf(stream,buf,buf?_IOFBF:_IONBF,BUFSIZ)
  • 2.3.3 setbuffer(设置文件流的缓冲区)

    头文件: #include<cstdio>

    函数声明: void setbuffer(FILE * stream,char * buf,size_t size);

    说明: 在打开文件流后,读取内容之前,调用 setbuffer() 可用来设置文件流的缓冲区.

  • stream 为指定的文件流
  • buf 指向自定的缓冲区起始地址
  • size 为缓冲区大小
  • 头文件: #include<cstdio>

    函数声明: void setlinebuf(FILE * stream);

    说明: setlinebuf() 用来设置文件流以换行为依据的无缓冲 IO.相当于调用 setvbuf(stream,(char * )NULL,_IOLBF,0);

    2.3.5 setvbuf(设置文件流的缓冲区)

    头文件: #include<cstdio>

    函数声明: int setvbuf(FILE * stream,char * buf,int mode,size_t size);

    说明: 在打开文件流后,读取内容之前,调用 setvbuf() 可以用来设置文件流的缓冲区

  • stream 为指定的文件流
  • buf 指向自定的缓冲区起始地址
  • size 为缓冲区大小
  • mode 取值有下列几种:
  • _IONBF 无缓冲 IO
  • _IOLBF 以换行为依据的无缓冲 IO
  • _IOFBF 完全无缓冲 IO.如果参数 buf 为 NULL 指针,则为无缓冲 IO
  • 2.4.1 fseek(移动文件流的读写位置)

    头文件: #include<cstdio>

    函数声明: int fseek(FILE * stream,long offset,int whence);

  • fseek() 用来移动文件流的读写位置
  • fseek() 不像 lseek() 会返回读写位置,因此必须使用ftell()来取得目前读写的位置
  • 函数声明: long ftell(FILE * stream);

    说明: ftell() 用来取得文件流目前的读写位置

    返回值: 当调用成功时则返回目前的读写位置,若有错误则返回 -1,errno 会存放错误代码(错误代码: EBADF 参数 stream 无效或可移动读写位置的文件流)

    2.4.3 rewind(重设文件流的读写位置为文件开头)

    头文件: #include<cstdio>

    函数声明: void rewind(FILE * stream);

    说明: rewind() 用来把文件流的读写位置移至文件开头。参数 stream 为已打开的文件指针。此函数相当于调用 fseek(stream,0,SEEK_SET)。

    2.4.4 clearerr(清除错误旗标)

    头文件: #include<cstdio>

    函数声明: void clearerr(FILE * stream);

    说明: clearerr() 清除 stream 指定的文件流所使用的错误旗标。

    2.4.5 fdopen(将文件描述词转为文件指针)

    头文件: #include<cstdio>

    函数声明: FILE * fdopen(int fildes,const char * mode);

    说明: fdopen()会将参数fildes 的文件描述词,转换为对应的文件指针后返回

    参数: mode 字符串则代表着文件指针的流形态,此形态必须和原先文件描述词读写模式相同。关于mode 字符串格式请参考fopen()。

    返回值: 转换成功时返回指向该流的文件指针。失败则返回NULL,并把错误代码存在errno中。

    2.4.6 feof(检查文件流是否读到了文件尾)

    头文件: #include<cstdio>

    函数声明: int feof(FILE * stream);

    说明: feof()用来侦测是否读取到了文件尾,尾数stream为fopen()所返回之文件指针。如果已到文件尾则返回非零值,其他情况返回0。

    返回值: 返回非零值代表已到达文件尾。

    2.4.7 fileno(返回文件流所使用的文件描述词)

    头文件: #include<cstdio>

    函数声明: int fileno(FILE * stream);

    说明: fileno()用来取得参数stream指定的文件流所使用的文件描述词。

    返回值: 返回文件描述词

    2.4.8 freopen(打开文件)

    头文件: #include<cstdio>

    函数声明: FILE * freopen(const char * pathconst char * mode,FILE * stream);

    说明: Freopen()会将原stream所打开的文件流关闭,然后打开参数path的文件。

  • path 字符串包含欲打开的文件路径及文件名
  • mode 请参考fopen()说明
  • stream 为已打开的文件指针
  • cout<< " 请输入要复制的文件路径(包括执行文件名和文件后缀名):\n " ; cin >> filepath; source = fopen(filepath.data(), " rb " ); if (source == NULL) cout << " 打开文件失败!从新 " ; continue ; fseek(source, 0 ,SEEK_END); length = ftell(source); char * data = new char [length]; rewind(source); fread(( void *)data, sizeof ( char ),length,source); cout << " 请输入文件粘贴路径(包括执行文件名和文件后缀名):\n " ; cin >> filepath; destination = fopen(filepath.data(), " wb " ); if (destination == NULL) delete data; cout << " 写入文件失败! " << endl; fclose(source); continue ; fwrite(( void *)data, sizeof ( char ),length,destination); fclose(destination); fclose(source); delete data; cout << " 关闭文件成功 " << endl; break ; system( " pause " );