YD T 3902-2021 数据中心无损网络典型场景技术要求和测试方法.pdf
《YD T 3902-2021 数据中心无损网络典型场景技术要求和测试方法.pdf》由会员分享,可在线阅读,更多相关《YD T 3902-2021 数据中心无损网络典型场景技术要求和测试方法.pdf(22页珍藏版)》请在麦多课文档分享上搜索。
1、ICS33.040.40 M32 YD 中华人民共和国 通信 行业标准 2018-2343T-YD 数据中心无损网络典型场景技术要求和测 试方法 Technical requirements and test methods for typical scenes of data center lossless network (报批稿) XXXX - XX - XX 发布 XXXX - XX - XX 实施 中 华 人 民 共 和 国 工 业 和 信 息 化 部 发 布 2018-2343T-YD I 目 次 前言 .II 1 范围 .1 2 术语、定义和缩略语 .1 3 数据中心无损网络典型
2、场景 .2 4 数据中心无损网络典型场景技术要求 .3 5 数据中心无损网络典型场景测试方法 .5 2018-2343T-YD II 前 言 本标准按照 GB/T 1.12009给出的规则起草。 请注意本文件的某些内容可能涉及专利。 本文件的发布机构不承担识别这些专利的责任。 本标准由中国通信标准化协会提出并归口。 本标准起草单位 : 中国信息通信研究院、中国电信集团有限公司、中国移动通信集团有限公司、百 度在线网络技术 (北京 ) 有限公司 、 北京三快云计算有限公司 、 华为技术有限公司 、 北京迈络思科技有 限公司 本标准 起草人 : 郭亮、赵继壮、顾戎、高峰、陈志勇、孙黎阳、宋庆春、李
3、洁、王峰、殷悦、朱朋 志、王少鹏 2018-2343T-YD 1 数 据中心无损网络典型场景技术要求和测试方法 1 范围 本标准规定了数据中心无损网络典型场景 、 数据中心无损网络典型场景技术要求 、 数据中心无损网 络典型场景测试方法的相关内容。 本标准适用于数据中心无损网络的设计、制造、测试和使用。 2 术语、定义和缩略语 2.1 术语和定义 下列术语和定义适用于本文件。 2.1.1 深度学习 deep learning 机器学习 的分支 , 是一种试图使用包含复杂结构或由多重非 线性变换 构成的多个处理层对数据进行 高层抽象的 算法 。 2.1.2 非易失性内存主机控制器接口规范 non
4、-volatile memory express 存储通信接口和协议 , 从概念设计到利用基于闪存的存储设备 (称为固态驱动器 ) 的低延迟和内部 并行性。 2.1.3 网络拥塞 network congestion 当网络节点或者链接运载的数据超过其可处理能力时带来的服务质量降低的现象 , 通常表现出的结 果有:延时、丢包和阻塞新连接。 2.1.4 零复制 zero-copy 计算机执行操作时, CPU不需要先将数据从某处 内存 复制到另一个特定区域。这种技术通常用于通 过网络传输文件时节省 CPU周期和内存带宽。 2.1.5 无阻塞网络架构 clos 多级电路交换网络的结构 , 它的最大的
5、优点就是对 Crossbar结构的改进 , 通过 Clos架构可以提供无 阻塞的网络;数据中心 CLOS网络架构一般是使用包交换的多级网络结构。 2018-2343T-YD 2 2.1.6 多对一通信 incast 一种后端服务器集群同时响应某一个服务器的数据请求,使得该服务器接收的流量激增的现象。 2.1.7 队头阻塞 head-of-line blocking 性能受限的现象,某一队列的第一个数据包(队头)受阻而导致整个队列数据包受阻的现象。 2.2 缩略语 下列缩略语适用于本文件。 AFA 全闪存阵列 All Flash Array AOC 有源光缆 Active Optical Cab
6、le CPU 中央处理器 Central Processing Unit ECMP 等价多路径路由 Equal-Cost Multi-Path Routing GPU 图形处理器 Graphics Processing Unit HPC 高性能计算 High-Performance computing IP 因特网协议 Internet Protocol NVMe 非易失性内存主机控制器接口规范 Non-Volatile Memory Express OLDI 在线数据密集型 On-Line Data Interchange PFC 基于优先级的流量控制 Priority-based Flow
7、 Control RDMA 远程直接内存访问 Remote direct memory access SSD 固态硬盘 Solid-State Drive TCP 传输控制协议 Transmission Control Protocol 3 数据中心无损网络典型场景 数据中心内的应用和存储体系结构在不断发展以满足对实时交互式数字技术日益增长的需求 。 当前 , 大型在线数据密集( OLDI) 服务,如用于在线购物, 社交媒体和网络搜索的自动推荐系统 ; 高性能深度 学习网络; NVMe高速存储业务等应用场景,都对未来数据中心提出了更高的要求和期望。 OLDI需要对高频率 、 高速率的请求进行即
8、时回答 。 延迟控制是网络的一个关键问题 。 最终用户体验 高度依赖于系统响应能力 , 即使是不到一秒钟的适度延迟 , 也会对个人查询及其相关广告收入产生可衡 量的影响。 在深度学习领域 , 构建神经网络和深度学习模型 , 称为训练的过程通常由高性能计算系统完成 。 训 练是一项高度并行的应用 , 需要低延迟和高吞吐量 。 投入更多的计算资源可以缩短创建模型所需的时间 ; 然而 , 并行应用中涉及的通信开销可能会抵消更多 CPU或 GPU的收益 。 如果发生同步延迟 , 会导致计算进 程停滞 。 而当训练过程中使用服务器时 , 网络中存在固有的 Incast问题 。 工作节点的集群几乎同时将结
9、 果返回给服务器 。 此场景会在连接参数服务器的交换机上产生拥塞 , 并可能导致数据包丢失和同步延迟 。 进一步对问题进行并行化只会导致延迟 , 因为需要在大量节点之间进行更多通信 , 从而增加网络拥塞的 影响。 NVMe快速可靠的特点,使得其非常适合未来云数据中心高度并行的环境。全闪存阵列( AFA)通过 网络进行 NVMe访问 , 需要极低的延迟才能满足业务的需求 。 但是 , NVMe存储的延迟和可靠性要求使这种 访问成为一项挑战。 2018-2343T-YD 3 综上所述 , 需要在未来数据中心新场景下解决丢包 、 时延 、 吞吐等多方面的挑战 , 实现数据中心网 络的无损失是当前亟待
10、解决的问题。 4 数据中心无损网络典型场景技术要求 4.1 流控技术要求 数据中心无损网络应有效避免 PFC头部阻塞造成的整网拥塞,应具备较低的时延。 4.2 拥塞控制技术要求 数据中心无损网络应为用户提供无丢包损失的相关技术。 数据中心无损网络应提供解决或缓解现有流控技术普遍存在的队头阻塞问题的能力 , 可采用的技术 包括:多队列技术、拥塞控制技术、鼠象流分离技术、拥塞隔离技术等。 数据中心无损网络宜提供多队列技术 , 具体是指无损网络可以基于流使用多个队列 , 实现更加细粒 度的流控 , 尽力预防和缓解队头阻塞 。 每个队列对应一个虚通道 , 无损网络中的接收设备从发送设备接 收的数据流报
11、文包含虚通道的标识 , 接收设备可以在接收到流的首包时根据流标识和流对应的候选虚通 道组为流选择一个与原有不同的新虚通道 , 将新的虚通道信息设置到流的表项 , 接收设备在回复应答时 从流的表项获取新的虚通道插入流的应答报文中 , 携带新的虚通道信息的应答报文到达发送设备后 , 发 送设备将流的虚通道更新为新的虚通道 , 后续报文携带新的虚通道标识 。 在接收设备中 , 每条流对应一 个可用虚通道组 , 从可用虚通道组中选择的一个或多个拥塞程度较低的虚通道构成候选虚通道组 , 接收 设备动态地更新候选虚通道组 , 接收设备为流选择新的虚通道时可以从候选虚通道组中选择任一虚通道 。 流的表项内容
12、包括据流的标识 、 表项是否有效 、 流的新虚通道等信息 , 表项初始无效 , 当接收设备需要 更新某条流的虚通道时若新的虚通道与原有不同则设置到该流的表项 , 并将表项设置为有效 , 后面接收 设备判断新虚通道与原有不同且表项有效则在应答报文中携带新虚通道以触发发送设备更新虚通道 , 虚 通道更新成功后将表项设置为无效 。 接收设备可以动态检测流对应虚通道的拥塞程度是否达到预设条件 , 如果达到预设条件则从当前实时的候选虚通道组中为流再选择新的虚通道 。 对于多种类型业务流量混跑 的场景,不同类型的业务流量对应的可用虚通道组中的虚通道一般都是不同的。 数据中心无损网络宜提供拥塞控制技术 ,
13、具体是指无损网络可以根据网络拥塞程度 , 及时地通知远 端进行降速 , 避免拥塞的流量长时间占据瓶颈端口 , 从而可以降低流控的持续实现 , 缓解队头阻塞问题 。 数据中心无损网络在提供拥塞控制技术时宜对时延敏感型流量流完成时间进行优化 。 数据中心小流 通常是时延更敏感的流量。在拥塞控制中,根据流的大小对流进行差异化的 ECN标记,使流的标记概率 与流的大小成正相关 , 可以减小小流被降速的概率 , 从而优化小流的完成时间 。 无损网络节点对进入队 列的数据流进行字节统计 , 根据流大小的阈值将数据流分为多个等级 , 并为不同等级的流设置与等级成 正相关的标记概率 , 使小流对应更低的标记概
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- YD 3902-2021 数据中心无损网络典型场景技术要求和测试方法 3902 2021 数据中心 无损 网络 典型 场景 技术 要求 测试 方法
