1、 ICS 27.101 F01 江 苏 省 地 方 标 准 工业企业能耗大数据采集质量评价规程 Evaluation regulation of energy consumption big data adaptation quality for Industrial enterprise XXXX - XX - XX 发布 2020 - 11 - 13 实施 2020 10 13 发布 DB32/T 3876-2020 发布 DB32/T 3876-2020 I 目 次 1 范围 .1 2 规范性引用文件 .1 3 术语和定义 .1 4 质量评价指标 .1 4.1 采集数据一致率 .1 4.
2、2 采集数据及时性 .2 4.3 采集数据覆盖率 .3 4.4 采集数据准确率 .4 5 质量评价等级评价 .5 5.1 采集数据一致率评价 .5 5.2 采集数据及时性评价 .5 5.3 采集数据覆盖率评价 .5 5.4 采集数据准确率评价 .6 5.5 采集数据综合评价 .6 6 评价方法及应用范围 .7 6.1 评价条件 .7 6.2 评价主体 .7 6.3 评价方法 .7 6.4 应用范围 .7 DB32/T 3876-2020 I 前 言 本标准按照 GB/T 1.1-2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由江
3、苏省软件和信息技术服务标准化技术委员会提出并归口。 本标准起草单位:南京擎天科技有限公司 、江苏擎天工业互联网有限公司、 江苏省节能技术服务中 心、中国信息通信研究院 。 本标准主要起草人:辛颖梅、汪晓刚、吴炎、孙洁晶、 施健健、张皓源 、仇卫文 、 陈妍珺、朱燕、 李论、 陈建、 赵沐雯、 王卫、刘思佳 DB32/T 3876-2020 I 引 言 本标准的制定 旨在促进工业 行业全产业链的 能耗 信息整合, 为评价能耗 大数据采集质量 提供 依据, 逐步提升工业行业 能耗大数据 的总体应用 水平 。 DB32/T 3876-2020 1 工业企业能耗大数据采集质量评价规程 1 范围 本标准
4、规定了工业企业能耗大数据采集数据质量评价的指标说明、等级评价和应用标准。 本标准适用于企业内部能耗采集的数据质量查检、评价,行业大数据应用单位查检采集数据质量。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB 17167-2006 用能单位能源计量器具配备和管理通则 3 术语和定义 下列术语和定义适用于本标准。 3.1 工业 大数据 industrial big data 工业企业自身及生态系统产生或使用的数据的总和 。 3.2 能耗数据 Energy co
5、nsumption data 能耗 数据是 反映能源 消费水平和节能 降耗 状况的主要指标, 该数据 说明单位经济 活动 中对能源的利 用程度 , 反映经济结构和能源利用率的变化。 3.3 数据 采集 Data adaptation 数据采集 是指从 传感器 和其它待测设备等模拟和数字被测 单元 中自动 采集数据 信号 ,发 送到 上位机 中进行分析,处理 。 4 质量评价指标 4.1 采集数据一致率 DB32/T 3876-2020 2 4.1.1 能源采集 数据应遵循统一的规范, 定义 统一的数据量纲 , 使得数据集合保持统一的格式 。能 耗数据 采集 的对象及能源分类编码按照 GB 17
6、167-2006 要求 , 以常 采 的 煤 、电、 油 、气 、蒸汽 、 水为例, 要求 采集的 数据项 如表 1所示 ,实际 采集数据项对比要求采集数据项, 以此判断 采集数据 的 一致率。 表 1 能源计量器具需采集数据项 计量器具类别 计量目的 要求采集数据项 衡器 进入生产环节的静 态计量 累积流量( kg) 进入生产环节的动 态计量 累积流量( kg)、瞬时流量( kg) 电能表 进出用能单位的直 流电能计量 A 相电流( A 安)、 B 相电流( A 安)、 C 相电流( A 安)、 A 相电压( V 伏特)、 B 相电压( V 伏特)、 C 相电压( V 伏特)、 A 相无功功
7、率( kvar 千乏)、 B 相无功功率( kvar 千乏)、 C 相无功功率( kvar 千乏)、 A 相有功( kWh 千 瓦时)、 B 相有功( kWh 千瓦时)、 C 相有功( kWh 千瓦时)、 A 相功率因数 (无量纲)、 B 相功率因数(无量纲)、 C 相功率因数(无量纲)、正向有功 电能( kWh 千瓦时)、反向有功电能( kWh 千瓦时)、总有功电能( kWh 千瓦 时)、尖值电能量( kWh 千瓦时)、峰值电能量( kWh 千瓦时)、平值电能量 ( kWh 千瓦时)、谷值电能量( kWh 千瓦时)、总功率( kW 千瓦)、总功率 因数(无量纲) 油流量计(装置) 重油、渣油
8、 累积流量( m)、瞬时流量( m)、温度() 、压力( Pa) 成品油 气体流量计(装置) 煤气 累积流量( m)、瞬时流量( m)、温度()、压力、体积( m)、密度 ( kg/m) 天然气 蒸汽 锅炉流量计(装置) 流量计量 累积流量( m)、瞬时流量( m)、温度()、 压力( Pa) 、体积( m)、密度( kg/m) 4.1.2 采集数据一致率是数据集中 包含符合标准的数据项数 与标准包含的 数据 项数的比值衡量的采 集数据 一致率 程度,采集数据 一致率 计算公式如下 。 .(1) 式中: DCR 采集数据一致率 SDC 数据集中符合标准的数据项数 SD 标准包含的数据数 4.2
9、 采集数据及时性 4.2.1采集数据及时性是指周期性采集过程中,指待评估数据产生到待评估数据提供的传输时间间 隔,以及相邻两次采集之间数据 更新 时间间隔的长短。 DB32/T 3876-2020 3 4.2.2能耗数据 采集系统 一般采用周期性测量方式,数据生产 到数据提供的 时间间隔一般 分为毫秒 级、秒级 、 分钟级 ,工业 企业能耗数据 采集周期一般分为秒级、分钟级、小时级及以上 , 相应 的 从数据 生产 到数据提供的 最大传输延迟时间一般 分为毫秒级、秒级 、 分钟 级,采集数据最大传输延迟时间与采 集 时间粒度量化标准 见表 2。 表 2 数据采集时间粒度和传输延迟时间标准 采集
10、周期类型 采集 时间粒度 最大 传输延迟 时间 秒级 10秒 1秒 10秒 且 1分钟 10秒 分钟级 1 分钟 且 15分钟 1分钟 15分钟且 60分钟 5分钟 小时级 60分钟且 24小时 15分钟 日级及以上 24小时及以上 1小时 4.3 采集数据覆盖率 4.3.1采集数据覆盖率是指工业企业实际能耗采集数据集占所有能耗数据集的比例。该指标能够衡 量数据集的完整程度,衡量标准包括 采集数据 数据范围 的 完整性和 采集数据 时间 的 连续性两个方面。 4.3.2采集数据范围的完整度是实际数据集包含的采集点位数与应涵盖采集点位数的比值衡量的采 集数据覆盖程度 , 如企业实际能耗采集点位数
11、量占企业全厂采集点位数量的比率,采集数据完整度计算 公式如下: .(2) 式中: RCR 采集数据范围完整度 RTP 数据集包含的采集点位数 TP 应涵盖采集点位数 4.3.3采集数据 时间 的 连续性是数据集缺失记录数与数据集记录标准总数的比值 衡量的数据集缺失 程度。包括数据消息缺失和单条消息数据项缺失。 ( 1) 采集数据消息缺失率计算公式如下: .(3) 式中: DSR 采集数据消息缺失率 DB32/T 3876-2020 4 NRS 数据集记录标准总数 RTD 数据集实际记录数 ( 2) 采集数据项缺失率计算公式如下: .(4) 式中: MSR 采集数据项缺失率 TM 数据集数据项标
12、准总数 RTM 数据集数据项实际数 4.4 采集数据准确率 4.4.1采集数据准确率是指数据记录的信息是否存在异常或错误。该指标能够衡量数据的准确程度, 衡量标准包括数据采集数据精度、采集数据异常水平及采集数据冗余程度三个方面。 4.4.2采集数据精度根据采集值 与 真实值 的接近程度 衡量数据的准确性 。 本标准规定了采集数据需 保留的小数位数。 数据精度达标率计算公式如下: .(5) 式中: QAR 采集 数据精度达标率 QAD 数据集中达到精度的数据记录数 TD 数据集记录总数 4.4.3采集数据异常水平根据设定有效阈值定位数据是否存在异常,并且计算出异常数据比率。 数据异常率计算公式如
13、下: .(6) 式中: ADR 采集数据异常率 AD 数据集中异常数据记录数 TD 数据集记录总数 4.4.4采集数据冗余程度根据重复数据判断是否存在冗余,并且计算出冗余数据比率。 数据冗余率计算公式如下: DB32/T 3876-2020 5 .(7) 式中: DRR 采集数据冗余率 RD 数据集重复数据记录数 TD 数据集记录总数 5 质量评价等级 评价 5.1 采集数据一致率 评价 采集数据一致率等级划分见表 3。 表 3 采集数据一致率等级划分 序号 指标分类 评分 1 采集数据一致率 DCR 100DCR 5.2 采集数据及时性 评价 采集数据及时性通过采集 周期类型中的 采集数据最
14、大传输延迟时间和采集 时间粒度予以 等级 划分 , 等级划分见表 4。 表 4 采集数据及时性等级划分 序号 采集 周期类型 采集 时间粒度 最大传输延迟 时间 评分 1 秒级 ( t,单位:秒 ) 10秒 1秒 100-(t/59)*10) 2 10 秒 且 1分钟 10秒 3 分钟级 ( t,单位:分 ) 1分钟 且 15 分钟 1分钟 90-( t/59) *20 4 15分钟且 60分钟 5 分钟 5 小时级 ( t,单位: h) 60分钟 且 24小时 15 分钟 70-(t/24)*20 6 日级及以上 24小时及以上 1 小时 50分 5.3 采集数据覆盖率 评价 采集数据覆盖率
15、等级划分见表 5。 表 5 采集数据覆盖率等级划分 序号 指标分类 评分 DB32/T 3876-2020 6 序号 指标分类 评分 1 采集数据范围完整度 RCR (完整度 越高 分数 越 高) 100*RCR 2 采集数据消息缺失率 DSR (缺失率 越低分数越高 ) 100*( 1-DSR) 3 采集数据项缺失率 MSR (缺失率 越低分数越高 ) 100*( 1-MSR) 5.4 采集数据准确率 评价 采集数据准确率等级划分见表 6。 表 6 采集数据准确率等级划分 序号 指标分类 评分 1 采集数据精度达标率 QAR (达标率 越高分数越高 ) 100*QAR 2 采集数据异常率 A
16、DR (异常率越低分数 越高 ) 40% 得 0分 40%: 100*( 1-ADR) 3 采集数据冗余率 DRR (冗余率 越低分数越高 ) 100*( 1-DRR) 5.5 采集数据综合评价 采集数据质量综合评价公式如下。采集数据质量评价指标类型及权重值见表 7。 .(8) 式中: DCR 采集数据一致率 CTR 采集数据及时率 RCR 采集数据范围完整度 DSR 采集数据消息缺失率 MSR 采集数据项缺失率 QAR 采集数据精度达标率 ADR 采集数据异常率 DRR 采集数据冗余率 表 7 采集数据质量评价指标类型及权重值 权重编码 指标分类 指标名称 权重 1 采集数据一致率 采集数据
17、一致率 0.11 DB32/T 3876-2020 7 权重编码 指标分类 指标名称 权重 2 采集数据及时性 采集数据及时性 0.10 3 采集数据覆盖率 采集数据范围完整度 0.13 4 采集数据消息缺失率 0.14 5 采集数据项缺失率 0.14 6 采集数据准确率 采集数据精度达标率 0.15 7 采集数据异常率 0.14 8 采集数据冗余率 0.09 6 评价方法及应用范围 6.1 评价条件 被评价的企业已实施工业能耗大数据采集,且系统可运行正常。 6.2 评价主体 企业自评、行业主管部门评价、第三方机构评价 。 6.3 评价方法 根据采集数据质量综合得分见表 8。 表 8 采集数据
18、质量综合得分 综合得分 评价 90 优 80(含) 且 90 良 60(含) 且 80 中 60 差 6.4 应用范围 6.4.1评为优的采集数据 可用于企业能源审计、节能监察、节能项目 (节能量 )验证、碳核查、碳交 易佐证支撑,以及企业级、行业级能耗大数据分析应用; 6.4.2评为良的采集数据 经过基本的数据清洗和简单数据处理后可用于企业能源审计、节能监察、 节能项目 (节能量 )验证、碳核查、碳交易佐证支撑,以及企业级、行业级能耗大数据分析应用; 6.4.3评为中的采集数据 经过严格的数据清洗和数据预处理后可用于企业级、行业级能耗大数据分 析应用、以及企业一般业务分析; 6.4.4评为差的采集数据为 不可用 数据。