1、,BSCI v3.02-1,规划复杂网络的排障,排障的方法,什么是故障排除,诊断的原则, 诊断是查找问题的本质及原因的过程。 诊断过程的基本元素包括:, 信息收集 分析, 排除原因 提出假设 测试,排障的方法, 排障方法是一个指导原则,它能够帮助你完成排障流程的各个阶段。,“Shoot from the Hip”方法, 根据常见的问题原因和应对方法快速地作出假设,有效地排除故障。, 示例:用户报告LAN的性能问题,根据该网络中以往碰到的问题,这种问题90%是由于接口双工不匹配造成的,其解决方法是将交换机的接口配置为100Mbps全双工。, 优点:若有效,这种方法是最快速的。, 缺点:若无效,则
2、这种方法对于后续的诊断意义不大。,结构化的排障, 结构化排障的关键在于排除原因。, 一旦你排除了不可能的原因,剩下那些原因(不论它多么难以置信)都, 常用排障方法包括Top Down(自上而下)、Bottom Up(自下而上)、Divide and Conquer(分而治之)、Follow the Path(根据报文经过的路径)、Spot the Differences(发现差别)、Move the Problem(移除问题)。,Top-Down排障, 根据OSI七层模型,从应用层到物理层进行排障,Bottom-Up排障, 根据OSI七层模型,从物理层到应用层进行排障,Divide and C
3、onquer, 从OSI七层模型的中间层次开始,根据结果向上或向下进行排障,Follow the Path遵循路径, 跟踪报文经过的路径,将无关的链路和设备排除在排障过程之外,Spot the Differences, 比较工作异常的设备或流程找出差异点,这样即便你不了解故障的,原因也能够针对问题实施一个解决方案。, 示例:Brach 1正常工作而Brach 2异常。你能否解决这个问题?,Move the Problem, 一种排障技术是替换设备,观察问题是否依旧存在、转移或消失? 例如你安装多台PC、笔记本电脑、交换机。笔记本电脑B连接,异常,你怀疑是硬件故障。, 如果问题出在交换机、线缆或
4、笔记本电脑,你如何发现?,讨论:排障案例, 一名外部的财务咨询来帮助您公司的管理者处理财务问题。他需要访问财务服务器。您已经在服务器上为他创建一个帐号,并且他的笔记本电脑安装了客户端软件。现在您公司的管理者叫你:“这名咨询无法连接到财务服务器。”, 你是一名网络支持工程师,能够访问所有网络设备,但不能访问服务器。 讨论:你如何处理这个问题?, 你的排障计划是怎样的?, 你将使用哪种或者哪些方法? 为什么你选择这些方法?, 该案例中你可以许多不同的方法,但是某些特定的因素有助于你选择一个,正确的方法:, 你只能访问网络设备,不能访问服务器意味着你能够独立处理14层的问,题,而57层的问题你需要依
5、靠其他人员。, 你可以访问客户端设备(咨询的笔记本电脑),你的排障可以从这里开始, 公司管理者的电脑上安装同样的客户端软件并且有访问权限,你可以比较2台电,脑的差异点,讨论:排障案例(续), 不同方法的优缺点:, Top Down:你可以从应用层开始测试,这对于确认故障是一个好的排错建议。它的缺点在于你无法很快发现一些简单的问题(例如线缆连接到错误的接口)。 Bottom Up:完整的自下而上检查整个网络不是一种非常有效的方法,它非常耗时。在本案例中你可以做初步的Bottom Up检查,即咨询的电脑到接入层交换机之间,这样可以排除线缆导致的问题, Divide and Conquer:非常可行
6、的方法,从咨询的电脑ping财务服务器。若成功,你知道问题可能出现在应用程序(当然你也要考虑是否防火墙的问题);若失败,你应该处理网络问题并进行修复。其优点是你可以快速地判断导致问题的范围,以及你是否需要将问题转交其他人处理, Follow the Path:与Bottom up类似,在该场景中一个完整的Follow the Path,方法效率比较低, Spot the Differences:你可以访问管理者和咨询的电脑,因此比较差异点是一种可能的策略;但是这些机器不是由单个IT部门维护,它们可能存在差异,因此找出差异点是比较困难的, Move the Problem:在该场景中用这种方法不大可能解决问题,但是如果其他方法表明咨询的电脑和接入交换机之间存在硬件问题,你可以采用该方法。,总结, 了解排障流程中的主要元素。 了解结构化排障方法的优点。, 了解常用的排障方法以及它们适合的不同场景。 在实际案例中应用排障方法的知识。,