5. 数据字典 
  因为DFD只表示出系统由哪几部分组成和各部分之间的关系,并没有说明各个成分(数据流,加工等)的含义。因此,仅有DFD还不足以描述用户的需求,必须通过数据字典详细描述各类数据实体对象。
  数据字典(Data Dictionary, 简记为DD)是各类数据描述的集合。
  
  数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程五个部分。其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
 (1). 数据项
  数据项是不可再分的数据单位。对数据项的描述通常包括以下内容:
  数据项描述={数据项名,数据项含义说明,别米,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系,数据项之间的联系}
  其中"取值范围"、"与其他数据项的逻辑关系"(例如该数据项等于另几个数据项的和,该数据项值等于另一数据项的值等)定义了数据的完整性约束条件,是设计数据检验功能的依据。
  可以用关系规范化理论为指导,用数据依赖的概念分析和表示数据项之间的联系。即按实际语义,写出每个数据项之间的数据依赖,他们是数据库逻辑设计阶段数据模型优化的依据。
 (2). 数据结构
  数据结构反映了数据之间的组合关系。一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。对数据结构的描述通常包括以下内容:
  数据结构描述={数据结构名,含义说明,组成:{数据项或数据结构}}
 (3). 数据流
  数据流是数据结构在系统内传输的路径。对数据流的描述通常包括以下内容:
  数据流描述={数据流名,说明,数据流来源,数据流去向,组成:{数据结构},平均流量,高峰期流量}
  其中"数据流来?quot;是说明该数据流来自哪个过程。"数据流取向"是说明该数据流将到那个过程去。"平均流量"是指在单位时间(每天、每周、每月等)里的传输次数。"高峰期流量"则是指在高峰时期的数据流量。
 (4). 数据存储
  数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。它可以是手工文档或手工凭单,也可以是计算机文档。对数据存储的描述通常包括以下内容:
  数据存储描述={数据存储名,说明,编号,输入的数据流,输出的数据流,组成:{数据结构},数据量,存取频度,存取方式}
  其中"存取频度"值每小时或每天或每周存取几次、每次存取多少数据等信息?quot;存取方式"包括是批处理还是联机处理;是检索还是更新;是顺序检索还是随机检索等。另外,"输入的数据流"要指出其来源,"输出的数据流"要指出其去向。
 (5). 处理过程
  处理过程的具体处理逻辑一般用判定表或判定书来描述。数据字典中只需要描述处理过程的说明性信息,通常包括以下内容:
  处理过程描述={处理过程名,说明,输入:{数据流},输出:{数据流},处理:{简要说明}}
  其中"简要说明"中主要说明该处理过程的功能及处理要求。功能是指该处理过程用来做什么(而不是怎么做),处理要求包括处理频度要求,如单位时间里处理多少事务、多少数据量、响应时间要求等。这些处理要求是后面物理设计的输入及性能评价的标准。

  可见,数据字典是关于数据库中数据的描述,即元数据,而不是数据本身。
  数据字典是在需求分析阶段建立,在数据库设计过程中不断修改、充实、完善的。
  明确地把需求收集和分析作为数据库设计的第一阶段是十分重要的。这一阶段收集到的基础数据(用数据字典来表达)和一组数据流程图(Data Flow Diagram,简称DFD)是下一步进行概念设计的基础。
  要强调两点:
 (1) 需求分析阶段的一个重要而困难的任务是收集将来应用所涉及的数据,设计人员应充分考虑到可能的扩充和改变,是设计易于更改,系统易于扩充,这是第一点。
 (2) 必须强调用户的参与,这是数据库应用系统设计的特点。数据库应用系统和广泛的用户有密切的联系,许多人要使用数据库。数据库的设计和建立又可能对更多人的工作环境产生重要影响。因此用户的参与是数据库设计不可分割的一部分。在数据分析阶段,任何调查研究没有用户的积极参加是寸步难行的。设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果承担共同的责任。