文件管理

Wu Jun 2019-05-28 20:57:19
01 数据结构与算法 > 数据结构

1 文件的基本概念

文件的检索有2种方式:

2 文件的分类

1)顺序文件

顺序文件是记录按其在文件中的逻辑顺序依次存入存储介质所建立的文件。

优点是连续存取的速度快,因此主要用于只进行顺序存取、批量修改的情况。

典型介质是磁带。

2)索引文件

索引文件概述

索引文件由索引区和文件数据区构成。

文件数据区按关键字有序的称为索引顺序文件(稀疏索引),否则为索引非顺序文件(稠密索引、通常是指索引文件)。

索引区指明逻辑记录和物理记录之间的一一对应关系,称为索引表。由索引项组成。索引项分为关键字和关键字对应的记录地址

索引文件在存储器上分为两个区:索引区和数据区。前者放索引表,后者放主文件。

检索步骤:

  1. 将外存上含有索引区的页块送入内存,查找所需记录的物理地址
  2. 将该记录的页块送入内存
ISAM

ISAM(索引顺序存取方法,Indexed Sequential Access Methed),是一种专为磁盘存取文件设计的文件组织方式,采用静态索引结构。

ISAM文件由多级主索引、柱面索引、磁道索引和主文件组成。

VSAM

VSAM(虚拟存储存取方法,Virtual Storage Access Method,也是一种索引顺序文件的组织方式,采用 B+ 树作为动态索引结构。

3)直接存取文件(散列文件)

在散列文件中,存储单位是桶。桶溢出时通过拉链法存到溢出桶中。

4)多关键字文件

多重表文件

多重表文件是将索引方法和链接方法相结合的一种组织方式,对每个需要查询的次关键字建立一个索引,同时将具有相同关键字的记录链接成一个链表,并将此链表的头指针、链表长度及次关键字作为索引表的一个索引项。

倒排文件

倒排文件和多重链表的区别在于次关键字索引的结构不同,倒排文件的次关键字索引称为倒排表。具有相同关键字的记录之间不进行链接,而是在倒排表中列出具有该次关键字记录的物理地址。

3 文件的存储

1)磁盘

磁盘通常称为直接访问存储设备。是随机存取设备。通常以存储非顺序文件为主,读取以扇区为单位。

使用磁盘主要有3个时间需要考虑:

2)磁带

磁带通常称为顺序存储设备,只能顺序访问。

存取单位是磁带长度,存储单位是块。

3)CD-ROM、闪存