DB37 T 4529—2022 海洋大数据分级存储技术规范.pdf
《DB37 T 4529—2022 海洋大数据分级存储技术规范.pdf》由会员分享,可在线阅读,更多相关《DB37 T 4529—2022 海洋大数据分级存储技术规范.pdf(9页珍藏版)》请在麦多课文档分享上搜索。
1、 ICS 35.240.99 CCS L 67 37 山东省地方标准 DB37/T 4529 2022 海洋大数 据分级存 储技术规 范 Technical specification for hierarchical storage of ocean big data 2022-07-25 发布 2022-08-25 实施 山东省市 场监督 管 理局 发 布 DB37/T 4529 2022 I 目 次 前言.II 1 范围.1 2 规 范性 引用 文件.1 3 术 语和 定义.1 4 缩 略语.1 5 数 据分 级.2 5.1 分级 要素.2 5.2 定级 规则.2 5.3 分级 等级 及
2、存 储要 求.2 6 分 级存 储技 术要 求.3 6.1 基本 要求.3 6.2 分级 存储 实现.3 6.3 数据 迁移.3 7 分 级存 储管 理要 求.4 7.1 设备 管理.4 7.2 资源 管理.5 7.3 策略 管理.5 7.4 监控 运维.5 参考文 献.6 DB37/T 4529 2022 II 前 言 本文件 按照GB/T 1.1 2020 标准 化工 作导则 第1 部分:标准化 文件 的结构 和起草 规则 的规 定起草。请注意 本文 件的 某些 内容 可能涉 及专 利。本文 件的 发布机 构不 承担 识别 专利 的责任。本文件 由山 东省 海洋 局提 出并组 织实 施。本
3、文件 由山 东省 海洋 标准 化技术 委员 会归 口。DB37/T 4529 2022 1 海 洋大数 据分级存 储技术 规范 1 范围 本文件 规定 了海 洋大 数据 的数据 分级 以及 分级 存储 的技术 要求 和管 理要 求。本文件 适用 于10 PB 级以 上 海洋大 数据 的分 级存 储与 管理。2 规范性 引用 文件 下列文 件中 的内 容通 过文 中的规 范性 引用 而构 成本 文件必 不可 少的 条款。其 中,注日 期的 引用 文件,仅该日 期对 应的 版本 适用 于本文 件;不注 日期 的引 用文件,其 最新 版本(包 括所有 的修 改单)适 用 于 本文件。GB/T 352
4、95 2017 信息 技术 大数 据 术语 3 术语和 定义 GB/T 35295 2017 界 定的 以及下 列术 语和 定义 适用 于本文 件。3.1 大数据 big data 具有数 据巨 大、种类 多样、流动 速度 快、特征 多变 等特性,并 且难 以用 传统 数据体 系结 构和 数 据 处理技术 进行 有效 组织、存 储、计 算、分析 和管 理的 数据集。来源:GB/T 37973 2019,3.1 3.2 海洋大 数据 ocean big data 具有大 数据 特征 的海 洋领 域数据 集。3.3 数据分 级 data classification 按照存 储效 能的 分级 规则
5、 对大数 据进 行定 级。3.4 分级存 储 hierarchical storage 采用相 应等 级的 存储 要求 对大数 据进 行存 储。3.5 迁移策 略 migration strategy 根据大 数据 的分 级等 级及 数据访 问量 要求 所建 立的 分级存 储实 施策 略。注:包括迁移触发条件、源存储设备、目标存储设备等。4 缩略语 下列缩 略语 适用 于本 文件。CPU:中央 处理 单元(Central Processing Unit)ETL:数据 提取、转 换和 加 载(Extract-Transform-Load)DB37/T 4529 2022 2 IOPS:每秒 读写
6、 次数(Input Output Operations Per Second)ORC:列式 存储(Optimized Row Columnar)PB:拍 字节,1PB=2 的50 次 方字节(Petabyte)RCFile:列 存储 文件(Record Columnar File)SQL:结构 化查 询语 言(Structured Query Language)5 数据分 级 5.1 分级要 素 海洋大 数据 分级 定级 主要 考虑的 要素 为海 洋大 数据 的访问 频率,即 根据 海洋 大 数据访 问量 从高 到 低来判断,可 分为 高频 率访 问的海 洋大 数据、一 般频 率访问 的海 洋
7、大 数据、低 频率访 问的 海洋 大数 据。5.2 定级规 则 海洋大 数据 分级 等级 分为 三级、二级、一 级,应按 照表1 进行 海洋 大数 据的 定 级。表1 海洋大 数据 等级 条件 及判 定规则 5.3 分级等 级及 存储 要求 相应等 级的 海洋 大数 据的 存储应 符合 表2 的规 定。表2 海洋大 数据 分级 等级 及存 储要求 数据分级等级 分级存储要求 三级 三级海洋大数据的存储应符合以下要求:1)应实现数据 实时访问,访问 延迟应小于5 ms;2)可扩展性:应采用可扩展的存储架构,当存储资源不足时应具备在线扩展能力,且不影响原存 储系统的正常运行;3)可靠性:多种手段保
8、护数据,确保数据100%不丢失,保证业 务99.999 99%高可用。二级 二级海洋大数据的存储应符合以下基本要求:1)可实现数据 实时访问,访问延迟应小于100 ms;2)可扩展性:具备一定的在线存储容量扩充能力,且不影响原存储系统的正常运行;3)可靠性:多种手段保护数据,确保数据100%不丢失,保证业 务99.999 9%高可用。等级条件 判定规则 判定等级 三级等级条件:高频率访问的海洋大数据。数据访问频次从高到低,排序前10%部分数据。三级 二级等级条件:一般频率访问的海洋大数据。数据访问频次从高到低,排序前10%30%部分数据。二级 一级等级条件:访问频率较低,或不经常被访 问的海洋
9、大数据,或归档的历史海洋大数据。数据访问频 次从高到 低,排 序30%100%部分数据。一级 注:根据对海洋大数据访问周期的统计结果,结合本机构的实际情况,对三级、二级、一级等级的存储空间比例进行适当调整。DB37/T 4529 2022 3 表2 海洋 大数 据分 级等 级及存 储要 求 数据分级等级 分级存储要求 一级 一级海洋大数据的存储应符合以下基本要求:1)可实现数据延迟访问,访问 延迟不高于5 min;2)可扩展性:应支持离线扩展能力,且不影响原存储系统的正常运行;3)可靠性:确保数据100%不丢失,保证业务99.999 9%高可用。6 分级存 储技 术要 求 6.1 基本要 求
10、海洋大 数据 存储 的基 本要 求:a)应提供 结构 化、非结 构化、半结 构化 数据 存储 和处 理等功 能;b)应 支 持分 布 式存 储,包 括分 布 式文 件 存储、分 布 式结 构 化数 据 存储、分 布 式列 式 数据 存储、分布式 图数 据存 储;c)应提供 时序 数据 存储 功能;d)应提供 实时 数据 存储 功能;e)应支持 批处 理计 算功 能,包括离 线批 量数 据处 理、在线批 量数 据处 理等 功能;f)应支持 实时 流处 理/计算 功 能;g)宜提供 数据 压缩 存储 功能,支持 压缩 存储 格式,包 括文本 格式、RCFile、ORC 等;h)宜提供 多副 本存
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB37 45292022 海洋大数据分级存储技术规范 4529 2022 海洋 数据 分级 存储 技术规范
