第二章 网络实现模型.ppt
《第二章 网络实现模型.ppt》由会员分享,可在线阅读,更多相关《第二章 网络实现模型.ppt(32页珍藏版)》请在麦多课文档分享上搜索。
1、第二章 网络实现模型,模型的重要性,网络算法学包含以下几个不同的领域: 协议,硬件,体系结构,操作系统,算法不同领域的专家通过简单的模型进行对话: 模型描述了问题的要点,又不涉及不必要的细节 最低程度:模型应能定义所需要的术语 最好情况:领域外的专家可以根据模型进行设计,并可由领域内的专家对设计进行验证,2.1 协议抽象模型,协议定义了: 通信实体之间交换的报文的格式和次序 在报文发送、接收或收到其它事件后采取的动作(通常给出一个协议状态机) 调用接口,2018/10/9,协议抽象模型(续),可将协议看成是加上了接口和报文格式定义的状态机: 一个上层接口调用使协议状态机初始化 在某个状态时,可
2、能发送一个报文、收到一个报文或发生一个定时器事件,并进入一个新的状态,常见而耗时的功能(TCP/IP),与数据包收发有关的功能: 数据操作:交换,数据拷贝,检查和计算 分配资源(如内存、CPU) 与协议处理有关的功能: 重组数据包 查表及修改状态 设置定时器 调度任务 数据包交付给应用: 解复用 控制切换,重要的性能指标,网络中两个最重要的性能指标: 吞吐量:每秒处理的包数(pps)或比特数(bps) 延迟:处理一个数据包的时间(典型地为最坏情况) 性能测量分为: 全局性能测量:如端到端延迟和带宽,使用网络管理工具(如OpenView)进行测量 本地性能测量:如路由器查找速度,使用计算机内部的
3、性能测量工具(如Oprofile, Vtune)测量 本课程关注本地性能,特别是数据包在本地的处理速度(时间),因特网环境的特点,链路速度已达到万兆量级 10Gbps已普及,40Gbps在数据中心很常见,100Gbps已出现 TCP流量占主导 大量应用使用TCP协议 小包很多 路由器收到的包中大约一半为最小长度(40字节)的包 移动互联网应用中大量都是小包 局部性很差 骨干网上,在一个非常短的时间内大约有一百万个并发流经过一个路由器 这意味着,在一个包上执行的计算,在未来短时间内重用到另一个包上的可能性很小,联网系统面临的挑战,高速链路 + 大量小包: 包速率很高 线速处理难度大:处理一个包的
4、时间必须非常短 高速链路 + 大规模并发流: 数据局部性很差 Cache用不上(命中率低) TCP流占主导 + TCP处理开销大: 优化TCP实现很重要,2.2 存储器,在现代计算机系统结构中,访存是最大的性能瓶颈: 存储器访问时间比指令执行时间长很多 处理器速度和访存速度之间的鸿沟越来越宽,使得访存瓶项问题更加突出访存构成了端节点和路由器的主要性能瓶颈许多系统优化工作都是围绕该问题的解决而展开的,2018/10/9,存储器的种类,寄存器: 由一组有序的触发器构成,访问同一个片上寄存器的耗时大约为0.5-1 ns。 SRAM: 由一组寄存器构成。一般情况下,片上SRAM的访问时间为1-2ns,
5、片外SRAM的访问时间为5-10ns。 DRAM: 存储单元组织成行、列二维结构。片上DRAM的访存延迟大约为30ns,最快的片外DRAM访存延迟为40-60ns,连续读的延迟约为100ns。,2018/10/9,存储器的种类(续),page-mode DRAM(快页内存): 提供行地址时,选中的那一行数据(4字节)进入到row buffer中 如果要访问的4个字节刚好位于同一行(页),不需要再提供列地址快页内存有利于快速访问局部性好的数据: 可以一次读取相邻的4个字节优化访存的措施: 有意识地组织数据,将那些要被读取的数据保存在连续位置,2018/10/9,存储器的种类(续),Interle
6、aved DRAM(交织内存) 将几个DRAM bank集成到一个内存芯片中,复用数据线和地址线 利用单个DRAM bank读写周期长的特点,在总线上交替完成对各个DRAM bank的访问 提高内存带宽典型的产品有: SDRAM:集成了2个bank RDRAM:集成了16个bank,2018/10/9,举例:流ID的流水化查找,应用需求: 路由器统计每个流发送的包数 每个流用五元组(共96位)进行描述 线速处理要求: 对于2.5Gbps链路和40字节最小数据包,流ID的查找时间不能超过128ns。(40*8/2.5Gb/s = 128ns) 问题规模: 核心路由器中大约有100万条并发的流,2
7、018/10/9,设计方案考虑,需要设计一个数据结构: 每个流维护一个计数器 支持插入和查找两种操作,查找为针对流ID的精确匹配 要求限制最坏情况下的查找时间 使用平衡二叉树 在SRAM中保存查找树? 维护100万条流的状态,需要约14MB空间,代价太高! 在普通DRAM中保存查找树? 若实现分支因子为2的二叉树,查找一个流需要20次访存;按照访存周期50ns计算,查找时间为1微秒!,2018/10/9,使用RDRAM实现二分查找,使用具有16个bank的RDRAM实现树高为16的二叉树,树中第i层的所有节点存储在bank i中。 查找芯片同时对16个数据包(流ID)进行查找,比如: 第一个读
8、周期(60ns):用第1个包的流ID查找bank 1中的根节点,得到bank 2(第二层)中要查找的节点; 第二个读周期:先用第1个包的流ID查找bank 2,再用第2个包的流ID查找bank 1中的根节点; 依次类推 流水线充满后,每60ns完成一个流ID的查找 问题: 层次为16的二叉树只能有216=64K个流ID,不能满足问题规模!,2018/10/9,使用RDRAM实现M=3的B-树,RDRAM允许快页模式,可一次读8个32比特的字(256比特)256比特的字可以存放2个96比特的流ID,以及3个20比特的指针构造一棵高度为16、M=3的B-树,可以保存31643,000,000个流I
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 网络 实现 模型 PPT
