Rumah > Artikel > Tutorial sistem > Nota Aplikasi Paip Linux dan FIFO
Tempat paip yang paling biasa adalah di dalam cangkerang, seperti:
$ ls | wc -l
Untuk melaksanakan arahan di atas, shell mencipta dua proses untuk melaksanakan masing-masing ls
和 wc
(通过 fork()
和 exec()
Lengkap), seperti berikut:
Seperti yang anda lihat dari gambar di atas, saluran paip boleh dianggap sebagai satu set paip air yang membolehkan data mengalir dari satu proses ke proses yang lain, yang mana asalnya nama paip.
Seperti yang anda lihat dari gambar di atas, dua proses disambungkan ke paip, supaya proses penulisan ls
就将其标准输出(文件描述符为1)连接到来管道的写入段,读取进程 wc
menghubungkan input standardnya (penerangan fail 0) ke hujung bacaan paip. Sebenarnya, kedua-dua proses ini tidak menyedari kewujudan paip, mereka hanya membaca dan menulis data dari deskriptor fail standard. Cangkang mesti melakukan kerja.
Paip ialah aliran bait, iaitu, tiada konsep mesej atau sempadan mesej apabila menggunakan paip:
lseek()
untuk mengakses data secara rawak dalam paipJika anda perlu melaksanakan konsep mesej diskret dalam saluran paip, maka anda mesti melengkapkan kerja ini dalam aplikasi. Walaupun ini mungkin, jika anda menghadapi keperluan ini adalah lebih baik untuk menggunakan mekanisme IPC lain, seperti baris gilir mesej dan soket datagram.
Percubaan untuk membaca daripada paip yang pada masa ini kosong akan menyekat sehingga sekurang-kurangnya satu bait telah ditulis pada paip.
Jika hujung penulisan paip ditutup, proses membaca data daripada paip akan melihat hujung fail (iaitu read()
kembali 0) selepas membaca semua data yang tinggal dalam paip.
Arah penghantaran data dalam saluran paip adalah sehala. Satu hujung paip digunakan untuk menulis dan hujung satu lagi digunakan untuk membaca.
Pada beberapa pelaksanaan UNIX lain, terutamanya yang berkembang daripada Keluaran Sistem V 4, paip adalah dua arah (dipanggil paip aliran). Paip dwiarah tidak dinyatakan dalam mana-mana standard UNIX, jadi sebaiknya elakkan bergantung pada semantik ini walaupun pada pelaksanaan yang menyediakan paip dwiarah. Sebagai alternatif, pasangan soket aliran domain UNIX (dicipta melalui panggilan sistem socketpair()
) boleh digunakan, yang menyediakan mekanisme komunikasi dua hala standard dan semantiknya bersamaan dengan paip aliran.
Jika berbilang proses menulis ke paip yang sama, maka jika jumlah data yang mereka tulis pada satu masa tidak melebihi bait PIPE_BUF, maka dapat dipastikan bahawa data bertulis tidak akan bercampur antara satu sama lain.
SUSv3 memerlukan PIPE_BUF sekurang-kurangnya _POSIX_PIPE_BUF(512)
。一个实现应该定义 PIPE_BUF(在 <limits.h></limits.h>
中)并/或允许调用 fpathconf(fd,_PC_PIPE_BUF)
untuk mengembalikan had atas praktikal untuk operasi tulis atom. PIPE_BUF berbeza pada pelaksanaan UNIX yang berbeza Contohnya, pada FreeBSD 6.0, nilainya ialah 512 bait, pada Tru64 5.1, nilainya ialah 4096 bait, dan pada Solaris 8, nilainya ialah 5120 bait. Di Linux, nilai PIPE_BUF ialah 4096.
write()
Panggilan akan Sekat sehingga semua data ditulis pada paip)Had PIPE_BUF hanya berkuat kuasa apabila data dipindahkan ke paip. Apabila data yang ditulis mencapai bait PIPE_BUF, write()
会在必要的时候阻塞知道管道中的可用空间足以原子的完成此操作。如果写入的数据大于 PIPE_BUF 字节,那么 write()
会尽可能的多传输数据以充满整个管道,然后阻塞直到一些读取进程从管道中移除了数据。如果此类阻塞的 write()
akan menyekat jika perlu sehingga terdapat ruang kosong yang mencukupi dalam paip untuk menyelesaikan operasi secara atom. Jika data yang ditulis lebih besar daripada PIPE_BUF bait, maka
Sebuah paip sebenarnya adalah penimbal yang dikekalkan dalam memori kernel Kapasiti penyimpanan penimbal ini adalah terhad. Setelah paip diisi, tulisan seterusnya ke paip disekat sehingga pembaca mengeluarkan beberapa data daripada paip.
🎜SUSv3 tidak menyatakan kapasiti penyimpanan saluran paip. Dalam kernel Linux lebih awal daripada 2.6.11, kapasiti storan paip adalah konsisten dengan saiz halaman sistem (contohnya, 4096 bait pada x86-32), dan bermula dari Linux 2.6.11, kapasiti storan paip ialah 65,536 bait. Keupayaan penyimpanan paip pada pelaksanaan UNIX lain mungkin berbeza-beza. 🎜一般来讲,一个应用程序无需知道管道的实际存储能力。如果需要防止写者进程阻塞,那么从管道中读取数据的进程应该被设计成以尽可能快的速度从管道中读取数据。
#include int pipe(int fd[2]);
pipe()
创建一个新管道fd
中返回两个打开的文件描述符,一个表示管道的读取端 fd[0]
,一个表示管道的写入端 fd[1]
调用 pipe()
函数时,首先在内核中开辟一块缓冲区用于通信,它有一个读端和一个写端,然后通过 fd
参数传出给用户进程两个文件描述符,fd[0]
指向管道的读端,fd[1]
指向管道的写段。
不要用 fd[0]
写数据,也不要用 fd[1]
读数据,其行为未定义的,但在有些系统上可能会返回 -1 表示调用失败。数据只能从 fd[0]
中读取,数据也只能写入到fd[1]
,不能倒过来。
与所有文件描述符一样,可以使用 read()
和 write()
系统调用来在管道上执行 IO,一旦向管道的写入端写入数据之后立即就能从管道的读取端读取数据。管道上的 read()
调用会读取的数据量为所请求的字节数与管道中当前存在的字节数两者之间的较小值。当管道为空时,读取操作阻塞。
Anda juga boleh menggunakan fungsi stdio pada paip (printf()
、scanf()
等),只需要首先使用 fdopen()
获取一个与 filedes
中的某个描述符对应的文件流即可。但在这样做的时候需要解决 stdio
Isu penimbal.
Paip boleh digunakan untuk komunikasi dalaman dalam proses:
Paip boleh digunakan untuk komunikasi dalam proses dalam hubungan persaudaraan (proses anak mewarisi salinan deskriptor fail dalam proses induk):
Adalah tidak disyorkan untuk menggunakan satu paip sebagai dupleks penuh, atau menggunakannya sebagai separuh dupleks tanpa menutup hujung baca/tulis yang sepadan Ini berkemungkinan membawa kepada jalan buntu: jika dua proses cuba membaca daripada paip pada masa yang sama Jika data diambil, maka adalah mustahil untuk menentukan proses mana yang akan berjaya membacanya dahulu, menyebabkan dua proses bersaing untuk data. Untuk mengelakkan keadaan perlumbaan ini daripada berlaku, anda perlu menggunakan beberapa jenis mekanisme penyegerakan. Pada ketika ini, anda perlu mempertimbangkan masalah kebuntuan, kerana kebuntuan mungkin berlaku jika kedua-dua proses cuba membaca data dari paip kosong atau cuba menulis data ke paip penuh.
Jika kita mahu aliran data dwiarah, kita boleh membuat dua paip, satu dalam setiap arah.
Malah, paip boleh digunakan untuk komunikasi antara mana-mana dua atau lebih proses yang berkaitan, selagi paip itu dicipta melalui proses nenek moyang yang sama sebelum siri fork()
panggilan yang mencipta proses anak.
Tutup deskriptor fail paip yang tidak digunakan bukan sahaja untuk memastikan proses tidak menghabiskan had deskriptor failnya.
Proses membaca data daripada paip menutup deskriptor tulis bagi paip yang dipegangnya, supaya pembaca dapat melihat penghujung fail selepas proses lain selesai mengeluarkan dan menutup deskriptor tulisnya. Sebaliknya, jika proses membaca tidak menutup hujung penulisan paip, maka selepas proses lain menutup deskriptor penulisan, pembaca tidak akan melihat penghujung fail walaupun telah membaca semua data dalam paip. Kerana pada masa ini kernel tahu bahawa sekurang-kurangnya satu deskriptor tulis paip terbuka, menyebabkan read()
tersumbat.
当一个进程视图向一个管道中写入数据但没有任何进程拥有该管道的打开着的读取描述符时,内核会向写入进程发送一个 SIGPIPE
信号,默认情况下,这个信号将会杀死进程,但进程可以选择忽略或者设置信号处理器,这样 write()
将因为 EPIPE
错误而失败。收到 SIGPIPE
信号和得到 EPIPE
错误对于标识管道的状态是有意义的,这就是为什么需要关闭管道的未使用读取描述符的原因。如果写入进程没有关闭管道的读取端,那么即使在其他进程已经关闭了管道的读取端之后,写入进程仍然能够向管道写入数据,最后写入进程会将数据充满整个管道,后续的写入请求会将永远阻塞。
当管道被创建之后,为管道的两端分配的文件描述符是可用描述符中数值最小的两个,由于通常情况下,进程已经使用了描述符 0,1,2,因此会为管道分配一些数值更大的描述符。如果需要使用管道连接两个过滤器(即从 stdin
读取和写入到 stdout
),使得一个程序的标准输出被重定向到管道中,就需要采用复制文件描述符技术。
int pfd[2]; pipe(pfd); close(STDOUT_FILENO); dup2(pfd[1],STDOUT_FILENO);
上面这些调用的最终结果是进程的标准输出被绑定到管道的写入端,而对应的一组调用可以用来将进程的标准的输入绑定到管道的读取端上。
popen()
#include FILE *popen (const char *command, const char *mode);
pipe()
和 close()
是最底层的系统调用,它的进一步封装是 popen()
和 pclose()
popen()
函数创建了一个管道,然后创建了一个子进程来执行 shell,而 shell 又创建了一个子进程来执行command
字符串
mode
参数是一个字符串:
mode
是 r
)还是将数据写入到管道中(mode
是 w
)command
中进行双向通信mode
的取值确定了所执行的命令的标准输出是连接到管道的写入端还是将其标准输入连接到管道的读取端popen()
在成功时会返回可供 stdio
库函数使用的文件流指针。当发生错误时,popen()
会返回 NULL
并设置 errno
以标示出发生错误的原因popen()
调用之后,调用进程使用管道来读取 command
的输出或使用管道向其发送输入。与使用 pipe()
创建的管道一样,当从管道中读取数据时,调用进程在 command
关闭管道的写入端之后会看到文件结束;当向管道写入数据时,如果 command
已经关闭了管道的读取端,那么调用进程就会收到 SIGPIPE
信号并得到 EPIPE
错误#include int pclose ( FILE * stream);
pclose()
函数关闭管道并等待子进程中的 shell 终止(不应该使用 fclose()
函数,因为它不会等待子进程。)pclose()
Apabila berjaya, status penamatan shell dalam proses anak akan dikembalikan (iaitu, status penamatan perintah terakhir yang dilaksanakan oleh shell, melainkan shell telah dibunuh oleh isyarat) sistem ()
, jika shell tidak boleh dilaksanakan, maka system()
一样,如果无法执行shell,那么 pclose()
会返回一个值就像子进程中的 shell 通过调用 _exit(127)
akan mengembalikan nilai sama seperti shell dalam proses anak dengan memanggil _exit(127)
untuk menamatkan perkara yang samapclose()
mengembalikan −1. Salah satu kesilapan yang mungkin berlaku ialah status penamatan tidak dapat diperolehApabila melakukan penantian untuk mendapatkan status shell dalam proses anak, SUSv3 memerlukan pclose()
与 system()
一样,即在内部的 waitpid()
dengan system()
adalah sama, iaitu secara dalaman waitpid()
Memulakan semula panggilan secara automatik selepas ia diganggu oleh pengendali isyarat.
dan system()
一样,在特权进程中永远都不应该使用 popen()
.
popen
Kebaikan dan keburukan:
command
命令之前程序先启动 shell 来分析 command
字符串,就可以使用各种 shell 扩展(比如通配符),这样我们可以通过 popen()
panggil arahan shell yang sangat kompleks popen()
调用,不仅要启动一个被请求的程序,还需要启动一个 shell。即每一个 popen()
dua proses akan dimulakan.从效率和资源的角度看,popen()
函数的调用比正常方式要慢一些pipe()` VS `popen()
pipe()
是一个底层调用,popen()
是一个高级的函数pipe()
单纯的创建管道,而 popen()
创建管道的同时 fork()
子进程popen()
在两个进程中传递数据时需要调用 shell 来解释请求命令;pipe()
在两个进程中传递数据不需要启动 shell 来解释请求命令,同时提供了对读写数据的更多控制(popen()
必须时 shell 命令,pipe()
则无硬性要求)popen()
函数是基于文件流(FILE)工作的,而 pipe()
是基于文件描述符工作的,所以在使用 pipe()
后,数据必须要用底层的read()
和 write()
调用来读取和发送由于 popen()
调用返回的文件流指针没有引用一个终端,因此 stdio 库会对这种流应用块缓冲。这意味着当 mode 的值为 w 来调用 popen()
时,默认情况下只有当 stdio 缓冲区被充满或者使用 pclose()
关闭了管道之后才会被发送到管道的另一端的子进程。在很多情况下,这种处理方式是不存在问题的。Tetapi jika anda perlu memastikan bahawa proses kanak-kanak boleh menerima data dari paip dengan segera, anda perlu menghubungi fflush()
或使用 setbuf(fp, NULL)
调用禁用 stdio 缓冲。当使用 pipe()
系统调用创建管道,然后使用 fdopen()
secara kerap Teknik ini juga boleh digunakan apabila mendapatkan aliran stdio yang sepadan dengan hujung penulisan paip
Jika dipanggil popen()
的进程正在从管道中读取数据(即 mode
是 r
),那么事情就不是那么简单了。在这样情况下如果子进程正在使用 stdio 库,那么——除非它显式地调用了 fflush()
或 setbuf()
,其输出只有在子进程填满 stdio 缓冲器或调用了 fclose()
之后才会对调用进程可用。(如果正在从使用 pipe()
创建的管道中读取数据并且向另一端写入数据的进程正在使用 stdio 库,那么同样的规则也是适用的。)如果这是一个问题,那么能采取的措施就比较有限的,除非能够修改在子进程中运行的程序的源代码使之包含对 setbuf()
或 fflush()
dipanggil.
Jika anda tidak boleh mengubah suai kod sumber, anda boleh menggunakan terminal pseudo untuk menggantikan paip. Pseudo-terminal ialah saluran IPC yang kelihatan pada proses sebagai terminal. Hasilnya ialah perpustakaan stdio mengeluarkan data dalam penampan baris demi baris.
Walaupun saluran paip di atas melaksanakan komunikasi antara proses, ia mempunyai had tertentu:
Untuk membolehkan komunikasi antara mana-mana dua proses, paip bernama (dinamakan paip atau FIFO) telah dicadangkan:
read()
,write()
,close()
。与管道一样,FIFO 也有一个写入端和读取端,并且总是遵循先进先出的原则,即第一个进来的数据会第一个被读走mkfifo
命令可以在 shell 中创建一个 FIFO:mkfifo [-m mode] pathname
pathname
是创建的 FIFO 的名称,-m
选项指定权限 mode
,其工作方式与 chmod
命令一样fstat()
和 stat()
函数会在 stat
结构的 st_mode
字段返回 S_IFIFO
,使用 ls -l
列出文件时,FIFO 文件在第一列的类型为 p
,ls -F
会在 FIFO 路径名后面附加管道符 |
#include #include int mkfifo(const char *pathname,mode_t mode);
mode
参数指定了新 FIFO 的权限,这些权限会按照进程的 umask
值来取掩码open() O_RDONLY
标记)将会阻塞直到另一个进程打开 FIFO 以写入数(open() O_WRONLY
标记)为止。相应地,打开一个 FIFO 以写入数据将会阻塞直到另一个进程打开 FIFO 以读取数据为止。换句话说,打开一个 FIFO 会同步读取进程和写入进程。如果一个 FIFO 的另一端已经打开(可能是因为一对进程已经打开了 FIFO 的两端),那么open()
调用会立即成功。在大多数 Unix 实现上(包含 Linux),当打开一个 FIFO 时可以通过指定 O_RDWR
标记来绕过打开 FIFO 时的阻塞行为。这样,open()
会立即返回,但无法使用返回的文件描述符在 FIFO 上读取和写入数据。这种做法破坏了 FIFO 的 IO 模型,SUSv3 明确指出以 O_RDWR
标记打开一个 FIFO 的结果是未知的,因此出于可移植性的原因,开发人员不应该使用这项技术。对于那些需要避免在打开 FIFO 时发生阻塞的需求,open()
的 O_NONBLOCK
标记提供了一种标准化的方法来完成这个任务:
open(const char *path, O_RDONLY | O_NONBLOCK); open(const char *path, O_WRONLY | O_NONBLOCK);
在打开一个 FIFO 时避免使用 O_RDWR
标记还有另外一个原因,当采用那种方式调用 open()
之后,调用进程在从返回的文件描述符中读取数据时永远都不会看到文件结束,因为永远都至少存在一个文件描述符被打开着以等待数据被写入 FIFO,即进程从中读取数据的那个描述符。
tee
创建双重管道线shell 管道线的其中一个特征是它们是线性的,管道线中的每个进程都能读取前一个进程产生的数据并将数据发送到其后一个进程中,使用 FIFO 就能够在管道线中创建子进程,这样除了将一个进程的输出发送给管道线中的后面一个进程之外,还可以复制进程的输出并将数据发送到另一个进程中,要完成这个任务就需要使用 tee
命令,它将其从标准输入中读取到的数据复制两份并输出:一份写入标准输出,另一份写入到通过命令行参数指定的文件中。
mkfifo myfifo wc -l
当一个进程打开一个 FIFO 的一端时,如果 FIFO 的另一端还没有被打开,那么该进程会被阻塞。但有些时候阻塞并不是期望的行为,而这可以通过在调用 open()
时指定 O_NONBLOCK
标记来实现。
如果 FIFO 的另一端已经被打开,那么 O_NONBLOCK
对 open()
调用不会产生任何影响,它会像往常一样立即成功地打开 FIFO。只有当 FIFO 的另一端还没有被打开的时候 O_NONBLOCK
标记才会起作用,而具体产生的影响则依赖于打开 FIFO 是用于读取还是用于写入的:
open()
调用会立即成功(就像 FIFO 的另一端已经被打开一样)open()
调用会失败,并将 errno
设置为 ENXIO
为读取而打开 FIFO 和为写入而打开 FIFO 时 O_NONBLOCK
标记所起的作用不同是有原因的。当 FIFO 的另一个端没有写者时打开一个 FIFO 以便读取数据是没有问题的,因为任何试图从 FIFO 读取数据的操作都不会返回任何数据。但当试图向没有读者的 FIFO 中写入数据时将会导致 SIGPIPE
信号的产生以及 write()
返回 EPIPE
错误。
在 FIFO 上调用 open()
的语义总结如下:
在打开一个 FIFO 时,使用 O_NOBLOCK
标记存在两个目的:
O_NOBLOCK
标记以便读取数据,接着打开 FIFO 以便写入数据例如,下面的情况将会发生死锁:
read()
和 write()
O_NONBLOCK
标记不仅会影响 open()
的语义,而且还会影响——因为在打开的文件描述中这个标记仍然被设置着——后续的 read()
和 write()
调用的语义。
有些时候需要修改一个已经打开的 FIFO(或另一种类型的文件)的 O_NONBLOCK
标记的状态,具体存在这个需求的场景包括以下几种:
O_NONBLOCK
打开了一个 FIFO 但需要后续的 read()
和 write()
在阻塞模式下运行pipe()
返回的一个文件描述符的非阻塞模式。更一般地,可能需要更改从除 open()
调用之外的其他调用中,如每个由 shell 运行的新程序中自动被打开的三个标准描述符的其中一个或 socket()
返回的文件描述符,取得的任意文件描述符的非阻塞状态O_NONBLOCK
设置的开启和关闭状态当碰到上面的需求时可以使用 fcntl()
启用或禁用打开着的文件的 O_NONBLOCK
状态标记。通过下面的代码(忽略的错误检查)可以启用这个标记:
int flags; flags = fcntl(fd, F_GETFL); flags != O_NONBLOCK; fcntl(fd, F_SETFL, flags);
通过下面的代码可以禁用这个标记:
flags = fcntl(fd, F_GETFL); flags &= ~O_NONBLOCK; fcntl(fd, F_SETFL, flags);
read()
和 write()
的语义FIFO 上的 read()
操作:
只有当没有数据并且写入端没有被打开时阻塞和非阻塞读取之间才存在差别。在这种情况下,普通的 read()
会被阻塞,而非阻塞 read()
会失败并返回 EAGAIN
错误。
当 O_NONBLOCK
标记与 PIPE_BUF
限制共同起作用时 O_NONBLOCK
标记对象管道或 FIFO 写入数据的影响会变得复杂。
FIFO 上的 write()
操作:
O_NONBLOCK
标记会导致在一个管道或 FIFO 上的 write()
失败(错误是 EAGAIN
)。这意味着当写入了 PIPE_BUF
字节之后,如果在管道或 FIFO 中没有足够的空间了,那么 write()
会失败,因为内核无法立即完成这个操作并且无法执行部分写入,否则就会破坏不超过 PIPE_BUF
Keperluan untuk operasi tulis atomiti baitPIPE_BUF
字节时,该写入操作无需是原子的。因此,write()
会尽可能多地传输字节(部分写)以充满管道或 FIFO。在这种情况下,从 write()
返回的值是实际传输的字节数,并且调用者随后必须要进行重试以写入剩余的字节。但如果管道或 FIFO 已经满了,从而导致哪怕连一个字节都无法传输了,那么 write()
会失败并返回 EAGAIN
ralatAtas ialah kandungan terperinci Nota Aplikasi Paip Linux dan FIFO. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!