乐趣区

关于linux:新建一个空文件占用多少磁盘空间

明天咱们来思考一个简略的问题。在 Linux 下你用 touch 命令新建一个空文件:

touch empty_file.txt

操作实现后,是否要消耗掉咱们的一些磁盘空间?需要的话,大略能耗费多少?嗯,是的,这个问题简略的超乎你的设想,然而不晓得你否能给你本人一个称心的答案。

我后面的几篇文章都是介绍的磁盘物理层面的形成,但这对于了解文件相干的问题帮忙可能还不够。从明天开始让咱们从物理层往上走,到 Linux 文件系统原理里去寻找答案。

实际出真知

我感觉可能先丢开内核原理,间接入手操作来试验更有意思一些。你肯定晓得 ls 这个命令你能够查看文件大小,那么让咱们就用它来看一下。

# touch abcdefghigklmn.txt  
# ls -l  
total 0  
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file  

额,ls命令通知我这个空文件占用的是 0。文件的大小的确是 0,因为咱们还没有为该文件写入任何内容。然而咱们当初要思考的是,一个空文件是否占用磁盘空间。所以直觉通知咱们这相对不可能,磁盘上多进去一个文件,怎么可能一点空间开销都没有!

为了解开这个谜底,还须要借助 df 命令。输出 df –i

# df -i
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
......
/dev/sdb1            2147361984 12785019 2134576965    1% /search

这个输入帮咱们展现了咱们文件系统中 inode 的应用状况。留神 IUsed 是 12785019。咱们持续新建一个空文件

# touch empty_file2.txt
df -i
Filesystem            Inodes   IUsed   IFree IUse% Mounted on
......
/dev/sdb1            2147361984 12785020 2134576964    1% /search
[@bjzw_46_76 temp]#

这下留神 IUsed 变成了 12785020。

哈哈,咱们的一个论断就进去了。新建一个空文件会占用一个 Inode

细说 inode

那么 inode 里都存了哪些和文件相干的信息呢?咱们再略微看一下内核的源代码。大家能够下载一份 linux 的源代码。以 ext2 文件系统为例,在我下载的 linux-2.6 里的文件 fs/ext2/ext2.h 中,能够找到内核对于 inode 构造体的定义。该构造体较为简单,次要存储除了文件内容以外的一些其余数据,咱们选一些比拟要害的截取进去:

struct ext2_inode {
        __le16  i_mode;         # 文件权限
        __le16  i_uid;          # 文件所有者 ID
        __le32  i_size;         # 文件字节数大小
        __le32  i_atime;        # 文件上次被拜访的工夫
        __le32  i_ctime;        # 文件创建工夫
        __le32  i_mtime;        # 文件被批改的工夫
        __le32  i_dtime;        # 文件被删除的工夫
        __le16  i_gid;          # 文件所属组 ID
        __le16  i_links_count;  # 此文件的 inode 被连贯的次数
        __le32  i_blocks;       # 文件的 block 数量
        ......
        __le32  i_block[EXT2_N_BLOCKS]; # 指向存储文件数据的块的数组
        ......

能够看到和文件相干的所属用户、拜访工夫等都是存在 inode 中的。另外在 include/linux/fs.h 中,还有个 VFS 层面的 inode 的定义,这里咱就不发散了。应用 stat 命令就能够间接看到文件 inode 中数据。

# stat test
  File: `test'
  Size: 0               Blocks: 0          IO Block: 1024   regular empty file
Device: 801h/2049d      Inode: 26          Links: 1
Access: (0644/-rw-r--r--)  Uid: (0/    root)   Gid: (0/    root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800

每个 inode 到底是多大呢?dumpe2fs 能够通知你(XFS 的话应用 xfs_info)。

# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size:               256

Inode size 示意每个 Inode 的大小。我的这台机器上,每个 inode 都是 256 字节。两个 inode 的大小正好对齐到磁盘扇区的 512 字节。

文件名存到哪里了

inode 构造体都看完了,搞了半天不晓得有没有发现一个问题,inode 里并没有存储文件名!!那么,文件名到底跑哪儿去了?

fs/ext2/ext2.h 中,我找到了如下文件夹相干的构造体

struct ext2_dir_entry {
         __le32  inode;                  /* Inode number */
         __le16  rec_len;                /* Directory entry length */
         __le16  name_len;               /* Name length */
         char    name[];                 /* File name, up to EXT2_NAME_LEN */};

这个构造体就是咱们司空见惯的文件夹。没错,文件名是存在其所属的文件夹数据结构中的,就是其中的 char name[] 字段。和文件名一起,文件夹里还记录了该文件的 inode 等信息。

论断

    1. 新建一个空文件须要消耗掉一个 inode,用来保留用户、创立工夫等元数据。
    1. 新建一个空文件还须要消耗掉其所有目录的 block 中肯定的空间,这些空间用来保留文件名,权限、工夫等信息

所以,看起来新建一个空文件而已,只有你想挖,真的能挖出很多常识的。最初分享一个咱们团队里同学遇到的一个故障。咱们的一台离线工作机间接歇菜了,重启后排查起因是 inode 被耗费光了。再追究发现一个过程创立了太多的空日志文件。尽管文件都是空文件,然而 inode 却被节约光了。起初让负责的同学批改了创立日志文件的逻辑,删掉了多进去的空文件,该机器恢复正常。



开发内功修炼之硬盘篇专辑:

  • 1. 磁盘开篇:扒开机械硬盘坚挺的外衣!
  • 2. 磁盘分区也是隐含了技术技巧的
  • 3. 咱们怎么解决机械硬盘既慢又容易坏的问题?
  • 4. 拆解固态硬盘构造
  • 5. 新建一个空文件占用多少磁盘空间?
  • 6. 只有 1 个字节的文件理论占用多少磁盘空间
  • 7. 文件过多时 ls 命令为什么会卡住?
  • 8. 了解格式化原理
  • 9.read 文件一个字节理论会产生多大的磁盘 IO?
  • 10.write 文件一个字节后何时发动写磁盘 IO?
  • 11. 机械硬盘随机 IO 慢的超乎你的设想
  • 12. 搭载固态硬盘的服务器到底比搭机械硬盘快多少?

我的公众号是「开发内功修炼」,在这里我不是单纯介绍技术实践,也不只介绍实践经验。而是把实践与实际联合起来,用实际加深对实践的了解、用实践进步你的技术实际能力。欢送你来关注我的公众号,也请分享给你的好友~~~

退出移动版