信息技术 数据质量评价指标
Information technology -- Evaluation indicators for data quality
1 范围
本标准规定了数据质量评价指标的框架和说明。
本标准适用于数据生存周期各个阶段的数据质量评价。
2 术语和定义
下列术语和定义适用于本文件。
2.1
数据
信息的可再解释的形式化表示,以适用于通信、解释或处理。
注:可以通过人工或自动手段处理数据。
[GB/T 5271.1-2000,定义01.01.02]
2.2
元数据
关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和数据易变性的数据。
[GB/T 5271.17-2010,定义17.06.05]
2.3
数据质量
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。
2.4
原始数据
终端用户所存储使用的各种未经过处理或简化的数据。
注:原始数据有多种存在形式,如文本数据,图像数据,音频数据或者几种数据混合存在。
2.5
数据生存周期
将原始数据转化为可用于行动的知识的一组过程。
2.6
数据集
具有一定主题,可以标识并可以被计算机化处理的数据集合。
2.7
数据模型
对分析的图像和文本表述,该分析识别了组织为完成其使命、功能、目标、目的和战略,以及管理和评价组织所需要的数据。
注1:在从高到低的不同抽象层次表示数据时,通常会区分概念模型(与某些努力相关的概念组成的模型)、逻辑模型和物理模型。
注2:所使用数据模型的使用周境的边界的正规描述,称为上下文模式。
注3:数据模型标识实体、域(属性)以及与其他数据的关系(关联),提供数据和数据间关系的概念视图。
评论
发表评论