从入门到精通,学会Linux重定向和管道工具加速你的工作流程!
提高工作效率、操作系统优化、自动化等是每个IT从业者所追求的目标。在Linux操作系统中,能够熟练使用重定向和管道命令行工具是必须掌握的技能之一。本文将通过实例详解重定向和管道工具的使用方法及原理。
我很喜欢 Linux 系统,尤其是 Linux 的一些设计很漂亮,比如可以将一些复杂的问题分解成若干小问题,通过管道符和重定向机制灵活地用现成的工具解决,写成 shell 脚本就很高效。

本文就分享一下我在实践中使用重定向和管道符遇到的一些坑,搞明白一些底层原理,写脚本的效率能提升不少。
> 和 >> 重定向符的坑
先说第一个问题,执行如下命令会发生什么?
$ cat file.txt > file.txt
读取再写入同一个文件,感觉什么也不会发生对吧?
实际上,上述命令运行的结果是清空file.txt文件中的内容。
PS:有的 Linux 发行版可能会直接报错,可以执行catfile.txt绕开这个检测。
前文 Linux 进程和文件描述符 说过,程序本身没有必要关心自己的标准输入/输出指向哪里,是 shell 通过管道符和重定向符号修改了程序的标准输入/输出的位置。
所以执行cat file.txt > file.txt这个命令时,shell 会先打开file.txt,由于重定向符号是>,所以文件中的内容会被清空,然后 shell 将cat命令的标准输出设置为file.txt,这时候cat命令才开始执行。
也就是如下过程:
1、shell 打开file.txt并清空其内容。
2、shell 将cat命令的标准输出指向file.txt文件。
3、shell 执行cat命令,读了一个空文件。
4、cat命令将空字符串写入标准输出(file.txt文件)。
所以,最后的结果就是file.txt变成了空文件。
我们知道,>会清空目标文件,>>会在目标文件尾部追加内容,那么如果将重定向符>改成>>会怎样呢?
$ echo hello world > file.txt # 文件中只有一行内容 $ cat file.txt >> file.txt # 这个命令会死循环
file.txt中首先被写入一行内容,执行cat file.txt >> file.txt后预期的结果应该是两行内容。
但是很遗憾,运行结果并不符合预期,而是会死循环不断向file.txt中写入 hello world,文件很快就会变得很大,只能用 Control+C 停止命令。
这就有意思了,为什么会死循环呢?其实稍加分析就可以想到原因:
首先要回忆cat命令的行为,如果只执行cat命令,就会从命令行读取键盘输入的内容,每次按下回车,cat命令就会回显输入,也就是说,cat命令是逐行读取数据然后输出数据的。
那么,cat file.txt >> file.txt命令的执行过程如下:
1、打开file.txt,准备在文件尾部追加内容。
2、将cat命令的标准输出指向file.txt文件。
3、cat命令读取file.txt中的一行内容并写入标准输出(追加到file.txt文件中)。
4、由于刚写入了一行数据,cat命令发现file.txt中还有可以读取的内容,就会重复步骤 3。
以上过程,就好比一边遍历列表,一遍往列表里追加元素一样,永远遍历不完,所以导致我们的命令死循环。
> 重定向符和 | 管道符配合
我们经常会遇到这样的需求:截取文件的前 XX 行,其余的都删除。
在 Linux 中,head命令可以完成截取文件前几行的功能:
$ cat file.txt # file.txt 中有五行内容 1 2 3 4 5 $ head -n 2 file.txt # head 命令读取前两行 1 2 $ cat file.txt | head -n 2 # head 也可以读取标准输入 1 2
如果我们想保留文件的前 2 行,其他的都删除,可能会用如下命令:
$ head -n 2 file.txt > file.txt
但是这就犯了前文说的错误,最后file.txt会被清空,不能实现我们的需求。
那我们是这样写命令是否可以避坑呢:
$ cat file.txt | head -n 2 > file.txt
结论是不行,文件内容依然会被清空。
What?是不是管道漏了,把数据全漏掉了?
前文 Linux 进程和文件描述符 也说过管道符的实现原理,本质上就是将两个命令的标准输入和输出连接起来,让前一个命令的标准输出作为下一个命令的标准输入。
但是,如果你认为这样写命令可以得到预期的结果,那可能是因为你认为管道符连接的命令是串行执行的,这是一个常见的错误,实际上管道符连接的多个命令是并行执行的。
你可能以为,shell 会先执行cat file.txt命令,正常读取file.txt中的所有内容,然后把这些内容通过管道传递给head -n 2 > file.txt命令。
虽然这时候file.txt中的内容会被清空,但是head并没有从文件中读取数据,而是从管道读取数据,所以应该可以向file.txt正确写入两行数据。
但实际上,上述理解是错误的,shell 会并行执行管道符连接的命令,比如说执行如下命令:
$ sleep 5 | sleep 5
shell 会同时启动两个sleep进程,所以执行结果是睡眠 5 秒,而不是 10 秒。
这是有点违背直觉的,比如这种常见的命令:
$ cat filename | grep 'pattern'
直觉好像是先执行cat命令一次性读取了filename中所有的内容,然后传递给grep命令进行搜索。
但实际上是cat和grep命令是同时执行的,之所以能得到预期的结果,是因为grep ‘pattern’会阻塞等待标准输入,而cat通过 Linux 管道向grep的标准输入写入数据。
执行下面这个命令能直观感受到cat和grep是在同时执行的,grep在实时处理我们用键盘输入的数据:
$ cat | grep 'pattern'
说了这么多,再回顾一开始的问题:
$ cat file.txt | head -n 2 > file.txt
cat命令和head会并行执行,谁先谁后不确定,执行结果也就不确定。
如果head命令先于cat执行,那么file.txt就会被先清空,cat也就读取不到任何内容;反之,如果cat先把文件的内容读取出来,那么可以得到预期的结果。
不过,通过我的实验(将这种并发情况重复 1w 次)发现,file.txt被清空这种错误情况出现的概率远大于预期结果出现的概率,这个暂时还不清楚是为什么,应该和 Linux 内核实现进程和管道的逻辑有关。
解决方案
说了这么多管道符和重定向符的特点,如何才能避免这个文件被清空的坑呢?
最靠谱的办法就是不要同时对同一个文件进行读写,而是通过临时文件的方式做一个中转。
比如说只保留file.txt文件中的头两行,可以这样写代码:
# 先把数据写入临时文件,然后覆盖原始文件
$ cat file.txt | head -n 2 > temp.txt && mv temp.txt file.txt
这是最简单,最可靠,万无一失的方法。
你如果嫌这段命令太长,也可以通过apt/brew/yum等包管理工具安装moreutils包,就会多出一个sponge命令,像这样使用:
# 先把数据传给 sponge,然后由 sponge 写入原始文件 $ cat file.txt | head -n 2 | sponge file.txt
sponge这个单词的意思是海绵,挺形象的,它会先把输入的数据「吸收」起来,最后再写入file.txt,核心思路和我们使用临时文件时类似的,这个「海绵」就好比一个临时文件,就可以避免同时打开同一个文件进行读写的问题。
在Linux操作系统中,重定向和管道是非常有用的命令行工具,可以让我们更好地掌握系统的运行状态和信息。掌握相关技能能够帮助我们更好地进行系统优化和自动化工作,从而更好地提高工作效率。相信通过本文的介绍,读者对重定向和管道的原理和使用方法都有了更为深入的了解。
以上是从入门到精通,学会Linux重定向和管道工具加速你的工作流程!的详细内容。更多信息请关注PHP中文网其他相关文章!

Linux和Windows在用户认证方面的主要差异在于:Linux使用PAM模块,而Windows依赖于ActiveDirectory和本地安全策略。1.Linux通过PAM提供灵活的认证配置,如密码、指纹等。2.Windows通过ActiveDirectory实现集中管理和企业网络集成。

本指南向您展示了如何使用QEMU模拟器在Linux环境中设置免费和开源DOS的操作系统Freedos。 这使您可以在现代硬件上运行Legacy DOS软件和游戏,而无需分开

Linux Mint,这款以简洁、稳定和易用性着称的操作系统,广受用户欢迎,尤其适合新手。 它默认使用Cinnamon桌面环境,提供简洁友好的用户界面。但如果您偏好不同的外观或需要更多自定义选项,可以安装其他桌面环境,例如KDE Plasma。 KDE Plasma是一个功能丰富、高度可定制且视觉效果出色的桌面环境,提供现代时尚的用户体验。它拥有广泛的自定义选项、高级窗口管理功能和精致的美感,非常适合希望更好地掌控桌面体验的用户。 本指南将逐步指导您在Linux Mint 22上安装KDE Pl

Linux系统性能优化:降低RAM和CPU使用率 Linux系统功能强大且高效,但高RAM和CPU使用率会降低性能,减慢应用程序速度,甚至导致服务器、工作站或嵌入式系统崩溃。因此,优化资源使用对于系统平稳运行至关重要。 本指南将探讨降低Linux系统RAM和CPU使用率的实用方法,涵盖监控工具、进程管理、内核调整和系统优化技术,帮助您保持系统高效运行。 识别资源密集型进程 降低RAM和CPU使用率的第一步是识别哪些进程消耗了最多的资源。为此,可以使用以下几个命令行工具: a. 使用top

AlmaLinux 8 和 9 的单用户模式 (也称为救援模式) 指南 单用户模式是一个精简的 Linux 环境,允许系统管理员执行维护任务、排查问题和从系统故障中恢复。当您需要重置 root 密码、修复配置错误、修复损坏的文件系统或调查阻止正常启动的系统错误时,单用户模式特别有用。 作为基于 RHEL 的发行版,AlmaLinux 8 和 9 通过 GRUB 引导加载程序提供了一种简单的进入单用户模式的方法。本指南将逐步解释如何在 AlmaLinux 8 和 9 上进入单用户模式。 什么是单用

Linux系统以其强大和可靠性着称,但即使是经验丰富的用户也会遇到意想不到的问题。无论是意外删除的文件、忘记的root密码,还是系统运行缓慢,高效的故障排除技巧是成为Linux专家的关键。 本指南将介绍一些常见的Linux问题解决场景以及逐步解决方案,这些问题在系统管理员、开发人员和日常Linux用户中普遍存在。 场景一:意外删除重要文件 您意外地使用rm命令删除了一个重要文件,现在需要恢复它。与Windows和macOS不同,Linux没有内置的“回收站”来存储从终端删除的文件。 恢复选项取决

Docker 是一款强大的工具,允许您在称为 容器 的隔离环境中运行应用程序。但是,有时您可能需要更改 Docker 文件夹的权限,以确保您的应用程序可以访问必要的文 件和目录。 本文将指导您完成在 Linux 系统上永久更改 Docker 文件夹权限的过程。 了解 Docker 文件夹权限 默认情况下,Docker 将其数据(包括镜像、容器和卷)存储在 Linux 系统上的特定目录中。最常见的目录是 /var/lib/docker。 这些文件夹的权限决定了谁可以读取、写入或执行其中的文件。如果

用Linux上的Portainer CE简化Docker Management:逐步指南 通过命令行管理Docker容器可能令人生畏,尤其是对于新移民而言。 Portainer CE(社区版)提供免费,轻巧且直观的Solutio


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

Atom编辑器mac版下载
最流行的的开源编辑器

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

禅工作室 13.0.1
功能强大的PHP集成开发环境

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能