Skip to content

文件管理

文件的属性

  • 文件名:用户最直观的感知
  • 标识符:操作系统内部用于区分各个文件的标志,对用户没有可读性
  • 类型:txt,py..
  • 位置,大小,创建者等等

  • 文件内部数据组织形式

    • 流式文件:无结构文件,由二进制字符流组成,如 txt 文件

    • 记录式文件:有结构文件.如xlsx文件

      • 文件之间的逻辑结构?
  • 操作系统向上提供文件的最基本功能

    • 创建文件:creat 系统调用
    • 删除文件:delete 系统调用
    • 打开文件:open 系统调用
    • 关闭文件:close 系统调用
    • 读文件:read 系统调用
    • 写文件:write 系统调用
  • 外存中文件的组织形式

    类似于内存分为一个个“内存块”,外存会分为一个个“块/磁盘块/物理块”。 每个磁盘块的大小是相等的,每块一般包含2的整数幂个地址 同样类似的是,文件的逻辑地 址也可以分为(逻辑块号,块内地址) 操作系统同样需要将逻辑地址转 换为外存的物理地址(物理块号,块内地址)的形式。 块内地址的位数取决于磁盘块的大小

文件的逻辑结构

  • 有结构文件的逻辑结构

    • 顺序文件:

      • 文件中的记录是按照某种顺序(顺序表或者链表之类的)排列的,可以是定长也可以是变长
      • 串结构:记录之间的顺序与关键词无关
      • 顺序结构:记录之间的顺序按关键词顺序排列

        • image_2024-03-28-23-00-37
    • 索引文件:

      • 顺序文件的查找效率较低,因此引入索引文件:建立一个索引表(定长记录的顺序文件),索引表中的每个记录包含一个关键字和一个指向对应数据记录的指针
    • 索引顺序文件:

      • 建立多级索引表以提高查找效率
  • image_2024-03-28-23-09-18

文件目录

  • 文件控制块:

    • 目录实际上也是一种数据结构
    • FCB 文件控制块:即目录文件中的一个记录

      • 每个文件对应一个 FCB(类似 PCB)
      • 最重要的数据是文件名和文件的地址
    • FCB 的有序集合就是文件目录

    • 对目录的操作:

      • 搜索,创建,删除文件,显示目录,修改目录
  • 目录结构

    • 单级目录结构:

      • 不允许文件重名,无法处理多用户
    • 两级目录结构:

      • 为每个用户建立一个文件夹,则可以处理不同用户之间需要相同文件名的需求
      • 此外还能设置权限设置
      • 缺点在于用户不能对自己的文件分类
    • 多级目录结构:

      • 解决上述问题
      • 但不便于文件共享
    • 无环图目录结构:

      • 可以用不同的用户名指向同一个文件(目录)
      • image_2024-03-29-22-05-42
  • 索引节点(FCB 的改进 )

    • 在使用文件名搜索的时候并不关心除了文件存在性的其他性质,因此可以对 FCB 进行"瘦身"
    • 使用 map:文件名\(\to\)索引节点指针(指向文件的其他属性)
  • image_2024-03-29-22-10-06

文件的物理结构

  • 操作系统对磁盘的管理:空闲和非空闲的磁盘块

    • 磁盘中的空间也分成了很多磁盘块,和内存块相同(很多时候设置和内存块大小相等,这样方便将外存读入内存 )
    • 文件的逻辑地址空间也被划分成了块
  • 连续分配

    • 每个文件在磁盘上有连续的块
    • image_2024-03-29-22-17-02
    • 磁盘需要读取数据的时候需要移动磁盘头,两个磁盘块相隔越远需要的时间就越长,所以连续分配所需要的移动磁头的时间就最少

      • 连续分配方式在顺序读写的时候最快
    • 缺点:

      • 拓展文件可能需要整体迁移文件

        • image_2024-03-29-22-20-02
      • 产生很多磁盘碎片

        • image_2024-03-29-22-20-50
    • (总结)连续分配方式要求每个文件在磁盘上占有一组连续的块。

      • 优点:支持顺序访问和直接访问(即随机访问);连续分配的文件在顺序访问时速度最快
      • 缺点:不方便文件拓展;存储空间利用率低,会产生磁盘碎片
  • 链接分配

    • 隐式链接:

      • 目录记录了文件的起始块号和终止块号
      • 除了文件最后一个磁盘块,每个磁盘块都有一个指向下一个磁盘块的指针(单链表)

        -不支持随机访问,只能顺序访问(查找效率低)

      • 这些指针对用户来说实际上是透明的

      • 拓展文件是很方便的,不会产生碎片,外存的利用率高
    • 显示链接:

      • 把链接各个文件的指针显示的存放在文件分配表(FAT:File Allocation Table)中
      • 目录只需要记录起始块号

        • image_2024-03-29-22-29-22
      • 逻辑块号到物理块号之间不需要读磁盘!

        • 支持顺序访问也支持随机访问
        • 相比隐式链接快很多,也不会有碎片
        • 唯一的缺点就是文件分配表需要占用一定的存储空间
  • 索引分配

    • 索引分配允许文件离散的分布,操作系统为每个文件建立一张索引表,记录每个逻辑地址块对应的物理块.索引表存放的磁盘称为索引块 ,数据存放的盘称为数据块
    • 文件 FCB 就只需要记录索引块(第几个磁盘块)的位置
    • 注:在显式链接的链式分配方式中,文件分配表FAT是一个磁盘对应一张.而索引分配方式中,索引表是一个文件对应一张。
    • 读取方法:用户给出逻辑块号\(i\to\)读取 FCB 找到索引表 \(\to\) 读取物理块号并访问即可
    • 支持随机访问,容易拓展文件,不会产生碎片
    • 缺点:索引表需要额外的存储空间

    • 当一个文件的大小超过一个索引块的容量时,一个磁盘块就放不下索引表了,此时可以

      • 1.链接方案

        • 将多个索引块链接起来,在每一个索引块中存放下一个索引块的地址即可
        • FCB 记录第一个索引块的地址

          • 不支持随机访问,只能顺序访问.因为下一个索引块的地址在上一个索引块中,必须要把前一个索引块读入内存才能知道下一个索引块的地址
          • 因此低效
      • 2.多层索引

        • 建立多级索引表,父表指向子表,子表指向数据块 -类似于多级页表 - image_2024-03-29-22-50-36

        • 缺点:尽管文件的大小很小,也还是需要多次 I/O 操作,因为需要从父目录索引下去

      • 3.混合索引

        • 多种索引方式的结合,一个文件的顶级索引表中即可能有直接索引(指向数据) 也可能有一级索引,二级索引等等
    • image_2024-03-29-22-57-35

  • 总结:image_2024-03-29-22-58-25

逻辑结构&物理结构

  • 实际上就是操作系统存储信息的时候可能会采用链式存储或者顺序存储之类的存储方式,代码中逻辑上相邻的数据不一定会相邻,不相邻的数据也不一定相邻或者不相邻,这取决于操作系统的存储管理方式

文件存储空间管理

  • 存储空间的管理和初始化
  • 文件卷
    • 文件卷
  • 目录区和文件区

  • 管理方法

  • 空闲表法:
    • 空闲块:
    • 空闲表
  • 空闲链表法:
    • 空闲盘块链
    • 以盘块为单位组成链
    • 空闲盘区链
    • 以盘区为单位组成链
    • 空闲链表
  • 位示图法:
    • 位示图
  • 成组链接法:
    • 超级块
    • alt text
  • alt text

文件的基础操作

通过目录块操作
  • 创建文件:
  • 调用 creat 系统调用
    • 需要的参数:文件大小,文件存放路径,文件名
  • 删除文件:
  • delete 系统调用
    • 需要的参数:存放路径,文件名
  • 打开文件:
  • open 系统调用
    • 需要的参数:存放路径,文件名,文件操作(w 写,r 读之类)
  • 涉及权限检查
  • 关闭文件
  • close 系统调用
    • 将打开文件表相关的部分删除,回收资源,打开计数器-1
  • 读文件:
  • read 系统调用
    • 指明读文件的名称,读取的字节数,读取的位置
  • 写文件:
  • write 系统调用
    • 指明写文件,写入的字节数,写入的位置(外存)
  • 文件基础操作

文件共享

  • 硬链接:
  • 硬链接
  • 软链接
  • 软链接

文件保护

  • 口令保护
  • 为文件设置口令,其他用户访问时需要输入口令

    • 保存口令的开销和验证的开销都小
    • 缺点是口令存放在系统内部,不够安全
  • 加密保护

  • 用密码(加密方式,如异或运算)对文件加密(操作系统保存了加密数据而不是原始数据)

    • 优点是保密性强,不需要在系统中存储密码
    • 缺点是编码,译码需要一定的时间
  • 访问控制

  • 在文件 FCB 中添加访问控制表,记录各个用户的权限

  • alt text

文件系统的结构层次

  • alt text

文件系统的全局结构

  • 物理格式化
  • 划分扇区,检测坏扇区,用备用扇区替换坏扇区
  • 逻辑格式化
  • 磁盘分区(卷)
  • 文件系统在内存中的结构:
  • 目录缓存:FCB 等等
  • 系统打开文件表
  • 进程打开文件表

虚拟文件系统&文件系统挂载

  • 虚拟文件系统
  • 向用户提供统一标准的系统调用结构,屏蔽底层文件系统的实现差异
  • 下层文件系统必须实现某些规定的函数功能
  • 每打开一个文件,VFS(虚拟文件系统) 就在主存中新建一个 vnode(存储文件信息)
  • 文件系统挂载
  • 如何把一个文件系统挂载到操作系统中:
    • 在 VFS 中注册新的文件系统(内存中的挂载表)包含各个文件系统的相关信息
    • 新挂载的文件系统要向VFS 提供一个函数地址列表(自己的函数地址列表,让 VFS 能调用自己的函数)
    • 将新文件系统加到挂载点上