Linux文件系统作为操作系统的核心组成部分,其运行机制也是我们程序员需要了解和掌握的,磁盘为系统提供了最基本的持久化存储,文件系统则在磁盘的基础上提供系统里所有文件的管理,在Linux里一切皆文件,不仅普通的文件和目录,就连块设备、套接字、管道等,也都要通过统一的文件系统来管理。今天我们就一起来聊一聊:磁盘和文件系统是怎么工作的?
索引节点和目录项
在Linux文件系统中,一个文件的元数据包括:目录项、索引节点、数据块。
- 目录项:简称为dentry,用来记录文件的名字、索引节点指针以及与其他目录项的关联关系。多个关联的目录项,就构成了文件系统的目录结构。目录项是由内核维护的一个内存数据结构,所以通常也被叫做目录项缓存(Cache)。
- 索引节点:简称为inode,用来记录文件的元数据,包括inode 编号、文件大小、访问权限、修改日期、数据的位置、链接数等,索引节点信息会持久化到磁盘中存储,占用磁盘空间。
- 数据块: 简称为block,存储文件数据的地方。磁盘的最小存储单位叫做扇区(Sector),每个扇区存储512字节,相当于0.5KB,操作系统读取硬盘的时候,不会一个扇区一个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个”块”(block)。这种由多个扇区组成的”块”,是文件存取的最小单位。”块”的大小,最常见的是4KB(八个sector)。
为了加速文件访问,索引节点通常会被加载到内存中,而硬盘在格式化时会划分为超级块、索引节点区和数据块区三个存储区域。
- 超级块,用来存储文件系统的详细信息,比如块个数、块大小、空闲块等等。
- 索引节点区,用来存储索引节点。
- 数据块区,用来存储文件或目录数据。
虚拟文件系统
Linux系统的虚拟文件系统(VFS,Virtual File System)是一个关键的抽象层,它为用户和应用程序提供了一致的文件系统接口,让它们可以以统一的方式访问各种类型的文件系统,而无需担心底层文件系统的实现细节。
用户程序和 glibc 库都属于用户空间,通过调用系统调用层(SCI)的函数来完成文件操作。这些函数是 Linux 内核提供的接口,用于用户向系统请求操作。例如,系统中的cat命令会调用open()函数打开文件,然后调用read()函数读取文件内容,最后调用write()函数将文件内容输出到控制台。常见的文件系统类型可分为几大类。
- 基于本地磁盘:EXT3、EXT4、XFS、OverlayFS 等。这类文件系统的特点是数据直接存储在计算机本地挂载的磁盘中,性能好,没有网络IO的访问消耗。
- 基于网络文件系统:NFS、CIFS/SMB、CephFS、GlusterFS等,这类文件的特点是它们允许用户通过网络访问和管理文件。分布式、跨平台、灵活性和可扩缩性是它们的最大优势。
- 基于内存文件系统:tmpfs、ramfs、/proc等,这些基于内存的文件系统通常用于特定的用途,如临时文件存储、缓存、快速数据访问等。它们提供了在内存中进行文件读写操作的高性能解决方案,但也需要注意内存限制和数据易失性的特点。
文件 I/O
我们进行磁盘分区和格式化是为了建立不同类型的文件系统,这些文件系统必须通过挂载到Linux的VFS上的特定目录才能被系统使用。文件的读写操作有不同的I/O类型,应用程序根据需要选择适当的方式进行。
缓冲与非缓冲I/O
- 所谓不带缓冲,并不是指内核不提供缓冲,而是只单纯的系统调用,不是函数库的调用。系统内核对磁盘的读写都会提供一个块缓冲,当用write函数对其写数据时,直接调用系统调用,将数据写入到块缓冲进行排队,当块缓冲达到一定的量时,才会把数据写入磁盘。因此所谓的不带缓冲的I/O是指进程不提供缓冲功能。每调用一次write或read函数,直接系统调用。(内核提供缓冲的)。
- 而带缓冲的I/O是指进程对输入输出流进行了改进,提供了一个流缓冲。当用write函数写数据时,先把数据写入流缓冲区中,当达到一定条件,比如流缓冲区满了,这时候才会把数据一次送往内核提供的块缓冲,再经块缓冲写入磁盘。(双重缓冲)
- 因此,带缓冲的I/O在往磁盘写入相同的数据量时,会比不带缓冲的I/O调用系统调用的次数要少。
直接 I/O与非直接I/O
- 直接I/O:就是应用程序直接访问磁盘数据,而不经过内核缓冲区,这样做的目的是减少一次从内核缓冲区到用户程序缓存的数据复制。
- 非直接I/O:就是文件读写时,先要经过系统的页缓存,然后再由内核或额外的系统调用后写入磁盘。
- 对于直接I/O,如果访问的数据不在应用程序缓存中,那么每次数据都会直接从磁盘加载,这种直接加载的效率会比较慢。但是类型于数据库管理系统这类应用,它们更倾向于选择它们自己的缓存机制,因为数据库管理系统往往比操作系统更了解数据库中存放的数据,使用直接I/O更合适。
阻塞I/O和非阻塞I/O
- 阻塞I/O:应用进程调用I/O操作时阻塞,只有等待要操作的数据准备好,并复制到应用进程的缓冲区中才返回。特点是:实现难度低、开发应用较容易,适用并发量小的网络应用开发。
- 非阻塞I/O:是指应用程序执行 I/O 操作后,不会阻塞当前的线程,可以继续执行其他的任务,随后再通过轮询或者事件通知的形式,获取调用的结果。特点是:相对来说复杂一些。适用并发量较小、且不需要及时响应的网络应用开发
同步和异步 I/O
- 同步I/O:是指应用程序执行 I/O 操作后,要一直等到整个 I/O 完成后,才能获得 I/O 响应。
- 异步I/O:是指应用程序执行 I/O 操作后,不用等待完成和完成后的响应,而是继续执行就可以。等到这次 I/O 完成后,响应会用事件通知的方式,告诉应用程序。
关于文件的一些常见小知识
磁盘剩余空间还很多,新建文件和目录报空间不足。
- 排查思路:大概率是小文件太多,inode用完了,可以使用df -i。
du和df统计的硬盘使用情况不一致问题。
- du是统计被文件系统记录到的每个文件的大小,然后进行累加得到的总大小,是通过文件系统获取到的。而df主要是从超级块(superblock)中读入硬盘使用信息,df获取到的是磁盘块被使用的情况。产生这种情况大概率是有文件被删除了,但是有别的进程正在使用它(占有句柄),可以通过lsof | grep deleted查到。当进程停止或者被kill时,这些空间将被释放。
我们查询磁盘容量的时候,Used+Avail的大小为啥总是小于总容量(SIze)。
- 为了预防紧急情况,linux ext文件系统会预留部分硬盘空间,具体预留的数值可以通过tune2fs -l [dev_name] | grep “Reserved block count”查看到,(dev_name)是设备名,这里预留的空间会被df计算到已用空间中,从而导致df和du统计不一致。如果需要调整预留空间大小, 我们可以使用tune2fs -m [size] [dev_name]来进行调整。
以上是想弄清楚Linux文件系统的运行机制吗?的详细内容。更多信息请关注PHP中文网其他相关文章!

在Outlook 365中下载或发送附件时,您是否遇到困难?有时,Outlook不会出于某些未知的原因向他们展示,因此您无法看到它们。在PHP.CN网站上的这篇文章中,我们收集了一些未显示附件的使用技巧。

当V Rising Players尝试加入已接近或已满的服务器时,他们可能会遇到“ V Rising Connection Time Out Out Out”问题。如果您是其中之一,则可以参考PHP.CN的这篇文章以获取解决方案。现在,继续阅读。

Windows通过Windows安全提供实时保护。但是此功能可能会阻止您做某件事,认为这很危险。在这种情况下,您可能需要暂时打开实时保护。这个php.cn帖子将向您展示如何

微软已经很早就开始研究明年的Windows更新。最近的谣言指出,2024年的下一个更新可能是Windows 11 24H2而不是Windows 12。现在一切都不确定。 PHP.CN现在将带您查看一些相关的信息

错误0x80030001试图复制文件时通常会发生。错误代码将伴随一条消息,该消息告诉“无法执行请求的操作”。如果您在此错误中挣扎,可以在php.cn w上阅读本文

2024年2月13日,微软发布了Windows 11 22H2和Windows 11 23H2的KB5034765(OS构建22621.3155和22631.3155)。此安全性更新为您带来了许多新的改进和错误修复。您可以学习如何下载和安装Windows 1

当您需要解决某些计算机问题时,设备管理器将被广泛使用。您可以检查有问题的设备并决定卸载或更新设备驱动程序。此外,您还可以在设备管理器中设置电源管理设置。但是,您可能会

当备份和还原(Windows备份)无法正常工作时,您可以选择将其重置为默认值。如何将Windows备份还原为Windows 11/10中的默认值? PHP.CN将指导您以两种方式轻松完成此操作,然后让我们去看它们。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

WebStorm Mac版
好用的JavaScript开发工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。