Rumah >Tutorial sistem >LINUX >Fail Linux I/O: prinsip dan kaedah

Fail Linux I/O: prinsip dan kaedah

PHPz
PHPzke hadapan
2024-02-09 18:27:271016semak imbas

Fail ialah kaedah penyimpanan data yang paling asas dan biasa digunakan dalam sistem Linux Ia boleh berupa fail teks, fail binari, fail peranti, fail direktori, dsb. Membaca dan menulis fail ialah salah satu operasi yang paling penting dalam pengaturcaraan Linux Ia melibatkan konsep seperti deskriptor fail, penimbal, panggilan sistem dan fungsi perpustakaan. Dalam artikel ini, kami akan memperkenalkan prinsip asas dan kaedah I/O fail Linux, termasuk membuka, menutup, membaca, menulis, meletakkan kedudukan, pemotongan, penyegerakan dan operasi lain, dan memberi contoh untuk menggambarkan penggunaan dan langkah berjaga-jaganya.

Fail Linux I/O: prinsip dan kaedah

Penerangan Fail

integer kecil dan bukan negatif untuk digunakan dalam panggilan sistem berikutnya (baca(2), tulis(2), lseek(2), fcntl(2), dsb.) ($man 2 terbuka) Apabila program mula berjalan, ia selalunya Terdapat 3 deskriptor fail terbuka:

  • 0: STDIN_FIFLENO, stdin input standard
  • 1: STDOUT_FILENO, standard output stdout
  • 2: STDERR_FILENO, ralat standard stderror

fd prinsip

  • fd bermula dari 0, mencari deskriptor terkecil yang tidak digunakan, dan mewujudkan hubungan yang sepadan antara penuding jadual fail dan deskriptor jadual fail (VS pid terus meningkat, dan kembali apabila ia penuh)
  • Deskriptor fail ialah int, digunakan untuk mewakili fail terbuka, tetapi maklumat pengurusan fail tidak boleh disimpan dalam deskriptor fail Apabila menggunakan fungsi open() untuk membuka fail, OS akan memuatkan maklumat yang berkaitan fail ke Walau bagaimanapun, disebabkan oleh faktor-faktor seperti keselamatan dan kecekapan, struktur data seperti jadual fail tidak sesuai untuk operasi langsung Sebaliknya, nombor diberikan kepada struktur dan nombor ini digunakan untuk operasi.
  • OS akan mengekalkan jadual induk deskriptor fail secara dalaman untuk setiap proses Apabila terdapat keperluan untuk deskriptor fail baharu, ia akan mencari deskriptor terkecil yang tidak digunakan dalam jadual induk dan mengembalikannya Walaupun deskriptor fail adalah jenis int. Tetapi ia sebenarnya adalah integer bukan negatif, iaitu, 0~OPEN_MAX (1024 dalam sistem semasa), yang mana 0, 1 dan 2 telah diduduki oleh sistem, masing-masing mewakili stdin, stdout dan stderror
  • Apabila menggunakan close() untuk menutup fd, surat-menyurat antara fd dan struktur jadual fail dialih keluar daripada jumlah jadual, tetapi struktur jadual fail tidak semestinya akan dipadamkan, hanya apabila jadual fail tidak sepadan dengan mana-mana fd lain. (iaitu, Jadual fail boleh sepadan dengan berbilang fd pada masa yang sama) sebelum jadual fail dipadamkan close() tidak akan mengubah nilai integer deskriptor fail itu sendiri, ia hanya akan menjadikan deskriptor fail tidak dapat mewakili a. fail
  • salinan fdVS pendua fd:dup menyalin penunjuk jadual fail yang sepadan dengan old_fd kepada new_fd, bukannya int new_fd=old_fd
  • UNIX menggunakan tiga struktur data untuk menerangkan fail terbuka: jadual deskriptor fail dalam setiap proses yang menerangkan fail yang dibuka oleh proses semasa, jadual pengenalan status fail yang mewakili status fail semasa dan fail i nod yang digunakan untuk mencari fail ( nod indeks) jadual nod V
    ini tidak digunakan dalam Linux Sebaliknya, ia adalah struktur inod umum, tetapi tidak ada perbezaan yang penting dari cakera sistem fail semasa membaca lokasi fail Fail Linux I/O: prinsip dan kaedah
Fail Linux I/O: prinsip dan kaedah

Bendera Deskriptor Fail

close-on-execSistem semasa hanya mempunyai satu bendera deskriptor fail

, iaitu hanya bendera Apabila proses memotong proses anak, bendera ini digunakan apabila fungsi exec dipanggil dalam proses anak. Maksudnya ialah sama ada hendak menutup deskriptor fail ini sebelum melaksanakan exec. 🎜
  • Secara amnya, kami akan memanggil exec untuk melaksanakan program lain Pada masa ini, teks, data, timbunan dan timbunan proses anak akan digantikan dengan program baharu. Pada masa ini, sudah tentu, pembolehubah yang memegang deskriptor fail tidak lagi wujud, dan kami tidak boleh menutup deskriptor fail yang tidak berguna. Oleh itu, biasanya kita menghentikan proses kanak-kanak dan secara langsung melaksanakan rapat dalam proses kanak-kanak untuk mematikan deskriptor fail yang tidak berguna, dan kemudian melaksanakan exec. Walau bagaimanapun, dalam sistem yang kompleks, kadang-kadang kita tidak lagi mengetahui berapa banyak deskriptor fail (termasuk pemegang soket, dll.) yang dibuka apabila kita memotong proses kanak-kanak Pada masa ini, sangat sukar untuk membersihkannya satu demi satu. Apa yang kami harapkan ialah menentukannya apabila membuka pemegang fail sebelum memotong proses anak: Saya akan menutup pemegang ini apabila melaksanakan exec selepas memotong proses anak." Jadi terdapat close-on-exec
  • Setiap deskriptor fail mempunyai bendera close-on-exec. Secara lalai sistem, bit terakhir bendera ini ditetapkan kepada 0. Bendera ini dimatikan. Kemudian apabila proses anak memanggil fungsi exec, proses anak tidak akan menutup deskriptor fail. Pada masa ini, proses ibu bapa dan anak akan berkongsi fail Mereka mempunyai entri jadual fail yang sama dan mengimbangi fail yang sama.
  • fcntl()FD_CLOEXECopen()O_CLOEXEC用来设置文件的close-on-exec Apabila bendera close-on-exec ditetapkan kepada 1, bendera ini dihidupkan Pada masa ini, sebelum proses anak memanggil fungsi exec, sistem telah meminta proses anak menutup deskriptor fail.

Nota: Walaupun versi baharu menyokong tetapan CLOEXEC semasa membuka, ralat masih akan digesa semasa penyusunan – ralat: ‘O_CLOEXEC’ tidak diisytiharkan (penggunaan pertama dalam fungsi ini). Fungsi ini perlu dihidupkan dengan menetapkan makro (_GNU_SOURCE).

#define _GNU_SOURCE //在源代码中加入   

-D_GNU_SOURCE   //在编译参数中加入  

Bendera Status Fail

Bendera status fail digunakan untuk mewakili atribut fail yang terbuka Bendera status fail boleh berkongsi status fail terbuka yang sama dengan menduplikasikan deskriptor fail, tetapi bendera deskriptor fail tidak boleh

  • Mod Akses: Menentukan mod akses fail: baca sahaja, tulis sahaja, baca-tulis. Ditetapkan oleh open(), dikembalikan oleh fcntl(), tetapi tidak boleh diubah
  • Bendera masa terbuka: Menunjukkan operasi apabila open() dilaksanakan. Bendera ini tidak akan disimpan selepas open() dilaksanakan
  • Mod Operasi: Menjejaskan operasi baca dan tulis, ditetapkan melalui open(), tetapi boleh dibaca atau ditukar dengan fcntl()

terbuka()
//给定一个文件路径名,按照相应的选项打开文件,就是将一个fd和文件连接到一起,成功返回文件描述符,失败返

回-1设errno
#include
int open(const char *pathname, int flags)
int open(const char *pathname, int flags, mode_t mode)//不是函数重载,C中没有重载, 是可变长参数列

表

//pathname:文件或设备路径
//flags :file status flags=Access mode+Open-time flags+Operating Modes、
/*Access Mode(必选一个):
O_RDONLY:0
O_WRONLY:1
O_RDWR:2
*/
/*Open-time Flags(Bitwise Or):
O_CLOEXEC   :为新打开的文件描述符使能close-on-exec。可以避免程序再用fcntl()的F_SETFD来设置

FD_CLOEXEC
O_CREAT     :如果文件不存在就创建文件,并返回它的文件描述符,如果文件存在就忽略这个选项,必须在保护模式

下使用,eg:0664
O_DIRECTORY :如果opendir()在一个FIFO或tape中调用的话,这个选项可以避免denial-of-service问题,  如

果路径指向的不是一个目录,就会打开失败。
O_EXCL      :确保open()能够穿件一个文件,如果文件已经存在,则会导致打开失败,总是和O_CREAT一同使用。
O_NOCTTY    :如果路径指向一个终端设备,那么这个设备不会成为这个进程的控制终端,即使这个进程没有一个控制

终端
O_NOFOLLOW  :如果路径是一个符号链接,就打开它链接的文

件//If pathname is a symbolic link, then the open fails.

O_TMPFILE   :创建一个无名的临时文件,文件系统中会创建一个无名的inode,当最后一个文件描述符被关闭的时

候,所有写入这个文件的内容都会丢失,除非在此之前给了它一个名字
O_TRUNC     :清空文件
O_TTY_INIT
*/
/*Operating Modes(Bitwise Or)
O_APPEND    :以追加的方式打开文件, 默认写入结尾,在当下的Unix/Linux系统中,这个选项已经被定义为一个原

子操作  
O_ASYNC     :使能signal-driven I/O

O_DIRECT    :试图最小化来自I/O和这个文件的

cache effect//Try to minimize cache effects of the I/O to and from this  file.
O_DSYNC     :每次写操作都会等待I/O操作的完成,但如果文件属性的更新不影响读取刚刚写入的数据的话,就不会

等待文件属性的更新    。
O_LARGEFILE :允许打开一个大小超过off_t(但没超过off64_t)表示范围的文件
O_NOATIME   :不更改文件的st_time(last access time)
O_NONBLOCK /O_NDELAY :如果可能的话,用nonblock模式打开文件
O_SYNC      :每次写操作都会等待I/O操作的完成,包括write()引起的文件属性的更新。
O_PATH      :获得一个能表示文件在文件系统中位置的文件描述符
#include
#include
int fd=open("b.txt",O_RDWR|O_CREAT|O_EXCL,0664);
if(-1==fd)
    perror("open"),exit(-1);

FQ:Mengapa Bitwise ORed:
FA: Adalah dipercayai bahawa terdapat model berikut: gunakan rentetan rentetan di mana satu bit adalah 1 dan selebihnya adalah 0 untuk mewakili pilihan, dan pilihan boleh "bitwise ANDed" untuk mendapatkan rentetan 0 /1, mewakili status keseluruhan bendera, Nota: tiga digit bawah mewakili Mod Akses

cipta()

Setara dengan memanggil open() dengan bendera O_WRONLY |O_TRUNC|O_CREAT

#include
int creat(const char *pathname, mode_t mode);

dup()、dup2()、dup3()

//复制一个文件描述符的指向,新的文件描述符的flags和原来的一样,成功返回new_file_descriptor, 失败返

回-1并设errno
#include 
int dup(int oldfd);             //使用未被占用的最小的文件描述符编号作为新的文件描述符

int dup2(int oldfd, int newfd);
#include       
#include 
int dup3(int oldfd, int newfd, int flags);
#include
#include
int res=dup2(fd,fd2);
if(-1==res){
        perror("dup2"),exit(-1);
Fail Linux I/O: prinsip dan kaedah

read()

//从fd对应的文件中读count个byte的数据到以buf开头的缓冲区中,成功返回成功读取到的byte的数目,失败返回-1设errno
#include 
ssize_t read(int fd, void *buf, size_t count);
#include 
#include
int res=read(fd,buf,6);
if(-1==fd)
    perror("read"),exit(-1);

write()

//从buf指向的缓冲区中读取count个byte的数据写入到fd对应的文件中,成功返回成功写入的byte数目,文件的位置指针会向前移动这个数目,失败返回-1设errno
#include 
ssize_t write(int fd, const void *buf, size_t count);//不需要对buf操作, 所以有const, VS read()没有const
#include 
#include
int res=write(fd,"hello",sizeof("hello"));
if(-1==res)
    perror("write"),exit(-1);

Note: 上例中即使只有一个字符’A’,也要写”A”,因为”A”才是地址,’A’只是个int

lseek()

l 表示long int, 历史原因

//根据移动基准whence和移动距离offset对文件的位置指针进行重新定位,返回移动后的位置指针与文件开头的距离,失败返回-1设errno
#include 
#include 
off_t lseek(int fd, off_t offset, int whence);
/*whence:
SEEK_SET:以文件开头为基准进行偏移,0一般不能向前偏
SEEK_CUR:以当前位置指针的位置为基准进行偏移,1向前向后均可
SEEK_END:以文件的结尾为基准进行偏移,2向前向后均可向后形成”文件空洞”
#include
#include
int len=lseek(fd,-3,SEEK_SET);
if(-1==len){
        perror("lseek"),exit(-1);

fcntl()

//对fd进行各种操作,成功返回0,失败返回-1设errno
#include 
#include 
int fcntl(int fd, int cmd, ... );       //...表示可变长参数
/*cmd:
Adversory record locking:
F_SETLK(struct flock*)  //设建议锁
F_SETLKW(struct flock*) //设建议锁,如果文件上有冲突的锁,且在等待的时候捕获了一个信号,则调用被打断并在信号捕获之后立即返回一个错误,如果等待期间没有信号,则一直等待 
F_GETLK(struct flock*)  //尝试放锁,如果能放锁,则不会放锁,而是返回一个含有F_UNLCK而其他不变的l_type类型,如果不能放锁,那么fcntl()会将新类型的锁加在文件上,并把当前PID留在锁上
Duplicating a file descriptor:
F_DUPFD (int)       //找到>=arg的最小的可以使用的文件描述符,并把这个文件描述符用作fd的一个副本
F_DUPFD_CLOEXEC(int)//和F_DUPFD一样,除了会在新的文件描述符上设置close-on-exec
F_GETFD (void)      //读取fd的flag,忽略arg的值
F_SETFD (int)       //将fd的flags设置成arg的值.
F_GETFL (void)      //读取fd的Access Mode和其他的file status flags; 忽略arg
F_SETFL (long)      //设置file status flags为arg
F_GETOWN(void)      //返回fd上接受SIGIO和SIGURG的PID或进程组ID
F_SETOWN(int)       //设置fd上接受SIGIO和SIGURG的PID或进程组ID为arg
F_GETOWN_EX(struct f_owner_ex*) //返回当前文件被之前的F_SETOWN_EX操作定义的文件描述符R
F_SETOWN_EX(struct f_owner_ex*) //和F_SETOWN类似,允许调用程序将fd的I/O信号处理权限直接交给一个线程,进程或进程组
F_GETSIG(void)      //当文件的输入输出可用时返回一个信号
F_SETSIG(int)       //当文件的输入输出可用时发送arg指定的信号
*/

/*…:    
可选参素,是否需要得看cmd,如果是加锁,这里应是struct flock*
struct flock {
    short l_type;   //%d Type of lock: F_RDLCK(读锁), F_WRLCK(写锁), F_UNLCK(解锁)
    short l_whence; //%d How to interpret l_start, 加锁的位置参考标准:SEEK_SET, SEEK_CUR, SEEK_END
    off_t l_start;  //%ld Starting offset for lock,     加锁的起始位置
    off_t l_len;    //%ld Number of bytes to lock , 锁定的字节数
    pid_t l_pid;    // PID of process blocking our lock, (F_GETLK only)加锁的进程号,,默认给-1
};
*/

建议锁(Adversory Lock)

限制加锁,但不限制读写, 所以只对加锁成功才读写的程序有效,用来解决不同的进程 同时同一个文件同一个位置 “写”导致的冲突问题
读锁是一把共享锁(S锁):共享锁+共享锁+共享锁+共享锁+共享锁+共享锁
写锁是一把排他锁(X锁):永远孤苦伶仃

释放锁的方法(逐级提高):

  • 将锁的类型改为:F_UNLCK, 再使用fcntl()函数重新设置
  • close()关闭fd时, 调用进程在该fd上加的所有锁都会自动释放
  • 进程结束时会自动释放所有该进程加过的文件锁

Q:为什么加了写锁还能gedit或vim写???

A:可以写, 锁只可以控制能否加锁成功, 不能控制对文件的读写, 所以叫”建议”锁, 我加了锁就是不想让你写, 你非要写我也没办法. vim/gedit不通过能否加锁成功来决定是否读写, 所以可以直接上

Q: So如何实现文件锁控制文件的读写操作????

A:可以在读操作前尝试加读锁, 写操作前尝试加写锁, 根据能否加锁成功决定能否进行读写操作

int fd=open("./a.txt",O_RDWR);                  //得到fd
if(-1==fd)
    perror("open"),exit(-1);
struct flock lock={F_RDLCK,SEEK_SET,2,5,-1};    //设置锁   //此处从第3个byte开始(包含第三)锁5byte
int res=fcntl(fd,F_SETLK,&lock);                //给fd加锁
if(-1==res)
    perror("fcntl"),exit(-1);

ioct1()

这个函数可以实现其他文件操作函数所没有的功能,大多数情况下都用在设备驱动程序里,每个设备驱动程序可以定义自己专用的一组ioctl命令,系统则为不同种类的设备提供通用的ioctl命令

//操作特殊文件的设备参数,成功返回0,失败返回-1设errno
#include 
int ioctl(int d, int request, ...);
//d:an open file descriptor.
//request: a device-dependent  request  code

close()

//关闭fd,这样这个fd就可以重新用于连接其他文件,成功返回0,失败返回-1设errno
#include 
int close(int fd);
#include 
#include
int res=close(fd);
if(-1==res)
        perror("close"),exit(-1);

通过本文,我们了解了Linux文件I/O的基本原理和方法,它们可以满足我们对文件的各种操作需求。我们应该根据实际需求选择合适的方法,并遵循一些基本原则,如关闭不用的文件描述符,检查错误返回值,使用合适的缓冲区大小等。文件I/O是Linux程序设计中不可或缺的一部分,它可以实现数据的持久化和交换,也可以提升程序的功能和性能。希望本文能够对你有所帮助和启发。

Atas ialah kandungan terperinci Fail Linux I/O: prinsip dan kaedah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:lxlinux.net. Jika ada pelanggaran, sila hubungi admin@php.cn Padam