主机及存储设备性能监控方案.doc
《主机及存储设备性能监控方案.doc》由会员分享,可在线阅读,更多相关《主机及存储设备性能监控方案.doc(18页珍藏版)》请在麦多课文档分享上搜索。
1、主机及存储设备性能监控方案 一 背景和目标 目前, 为各省配备的 小型机和存储设备都已进入 稳定运行阶段,总局信息中心 决定在各省开展小型机和存储设备的性能 监控工作,对小型机和存储设备的主要性能数据进行定期采 集 , 了解和掌握当前设备的性能和压力状况,为 基础设施的运行维护、资源优化和 建设规划工作 积累经验和 提供 依据。 二 监控范围 主机及存储设备性能监控的范围主要包括总局统一为各省配备的HP小型机 ( superdome)、 IBM小型机( P595, P570)和 EMC磁盘阵列设备。 三 监控时间 主机及存储设备性 能监控工作将 对连续 3个月内的关键时间点 对 HP小型机、
2、IBM 小型机和 EMC 磁盘阵列 设备 的关键性能指标 进行数据采集 , 建议在系统忙时和闲时分别进行检测。一般建议 每月至少 监控 4天,其中征期至少两天,非征期至少两天; 每天监控 至少 4 次 , 其中忙时至少两次 ,闲时至少两次 。 具体监控时间和详细的监控次数,各省可根据本省的业务特点进行确定和调整。 四 监控方式 主机及存储设备性能监控通过运行小型机及存储设备自带的命令对关键性能指标进行查看 ,并进行 数据采集。技术方案第五部分详细介绍了 HP小型机、 IBM小型机和 EMC磁盘阵列 性能监控 命令的操作指南 。数据采集工作可 直接按照操作指南运行命令进行, 也 可以通过运行命令
3、脚本(详见附件三)进行。 五 操作指南 5.1 IBM 小型机性能监控方案 5.1.1系统性能检查方式及说明 : (一) IBM小型机性能监控 均 通过 IBM AIX系统自带命令,非第三方软件。 IBM AIX系统安装后,无需额外安装任何 软件 包即可使用。 (二) IBM 小型机性能监控 的命令,均不额外增加系统负荷。即是说当系统繁忙度较高时,仍可执行下列命令,且不对系统造成影响。 (三) 采样数据的保存。通过执行 IBM小型机性能监控 命令 , 输出 结果的保存办法,一般 常用以下几种: 1、使 用专业的 telnet 工具登录到主机上 。 专业 telnet 工具均会含有“捕获输出文字
4、”的功能,只要打开捕获输出文字功能,所有的输出均会记录到文件中。(推荐,不影响系统) 2、 使用 AIX系统的输出重定向功能。 命令格式 : # 命令 文件名 上面的方式是将命令的输出结果直接输出到一个文件中。 例如: # vmstat 2 10 /tmp/vm_output 这个命令会将 命令 vmstat 2 10 的输出结果放在 /tmp 目录下的vm_output文件中。 5.1.2 IBM 小型机性能监控方案 IBM小型机性能监控方案主要对 IBM小型机的 CPU状况、磁盘 I/O吞吐状况、内存及虚拟内存使用率和 硬盘空间 状况等关键指标进行性能监控,具体操作如下: CPU状况 监控
5、方式 :通过 vmstat命令检查系统 CPU使用情况 操作示例 : #vmstat 2 10 参数 说明 : 2 表示每隔 2 秒取样一次, 10 表示共取样 10 次。这 2 个 参数 的具体值 可以根据需要自由定义。 输出示例: # vmstat 2 10 System configuration: lcpu=2 mem=3920MB kthr memory page faults cpu - - - - - r b avm fre re pi po fr sr cy in sy cs us sy id wa 0 0 229367 332745 0 0 0 0 0 0 3 198 69
6、0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 3 33 66 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 2 33 68 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 80 306 100 0 1 97 1 0 0 229367 332745 0 0 0 0 0 0 1 20 68 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 2 36 64 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 2 33 66 0 0 99 0 0 0 22
7、9367 332745 0 0 0 0 0 0 2 21 66 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 1 237 64 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 2 19 66 0 0 99 0 0 0 229367 332745 0 0 0 0 0 0 6 37 76 0 0 99 0 输出 说明 : ( 1) page部分 pi列表示 page in; po列表示 page out。 pi和 po的 数值一般为 0。 如果长期不为 0, 说明 系统需要频繁的进行从硬盘上的虚拟内存部分进行页的交换, 物理内存不足 。
8、 ( 2) cpu部分 : us列表示用户进程占用的 CPU的百分比 ; sy列表示系统进程占用的 CPU的百分比 ; id列表示空闲的 CPU的百分比 ; wa表示 CPU处于等待 IO状态的百分比 .; 一般如果 id项的值长期低于 20%说明系统 CPU不足 , 须考虑增加CPU 或优化程序 ; 如果 wa 的值长期高于 us 和 sy, 说明系统 IO 存在瓶颈 .须用 topas,iostat等命令确定瓶颈所在并增加 IO吞吐量 。 磁盘 IO吞吐 监控方式 :通过 iostat命令检查磁盘 IO状况 操作示例 : #iostat 2 10 参数说明 : 2 表示每隔 2 秒取样一次
9、, 10 表示共取样 10 次。这 2 个 参数的 数 值 可以根据需要自由定义。 输出 示例 : # iostat 2 10 System configuration: lcpu=16 drives=108 ent=8.00 paths=3 vdisks=0 tty: tin tout avg-cpu: % user % sys % idle % iowait physc % entc 0.0 0.0 0.0 0.0 100.0 0.0 0.0 0.1 - - - - - Disks: % tm_act Kbps tps Kb_read Kb_wrtn hdisk0 0.0 0.0 0.0
10、0 0 hdisk1 0.0 0.0 0.0 0 0 hdisk2 0.0 0.0 0.0 0 0 hdisk4 0.0 0.0 0.0 0 0 hdisk3 0.0 0.0 0.0 0 0 cd0 0.0 0.0 0.0 0 0 输出说明: 输出结果 输出结果会按照每个磁盘进行排列 , 主要观察的参数如下 : ( 1) % tm_act 说明该磁盘处于活动状态的时间比率 。 ( 2) Kbps 说明该磁盘每秒的读写数据量 。 如果 tm_act 长期处于 90%以上的状态 , 且 Kbps 数据量很大 , 则说明该磁盘繁忙程度过高 , 需要通过增加磁盘或者更改应用来将数据量平均分配到其他磁盘
11、 。 内存及虚拟内存使用率 监控方式 :通过 lsps a命令 查看交换分区状况来了解系统内存及虚拟内存使用情况 。 操作示例 : #lsps a 输出 示例: #lsps a Page Space Physical Volume Volume Group Size %Used Active Auto Type hd6 hdisk0 rootvg 6144MB 1 yes yes lv 输出 说明 : ( 1) Page Space:列出该交换分区的逻辑卷名称 。 ( 2) Physical Volume:列出该交换分区位于那个物理卷,在有条件的情况下 建议交换分区分散分布在不同的物理卷上以提
12、高性能 。 ( 3) Size:该交换分区的大小。 一般交换分区的大小不应小于物理内存的大小,对于硬盘空间紧张的系统,至少也要保证物理内存的一半大小。 ( 4) %Used :交换空间的使用率。 如果使用率长期高于 80,需要增加交换分区 的大小(该操作可在线完成)。 ( 5) Active: 表示该分区是否已经激活 。 ( 6) Auto: 表示该分区是否在每次重启后自动激活 .。 硬盘空间 监控方式 :通过 #lsvg rootvg 命令 查看卷组信息来了解 硬盘 空间分配情况 。 操作示例 : #lsvg rootvg 输出示例 : VOLUME GROUP: rootvg VG IDE
13、NTIFIER: 000bc6fd00004c00000000fda469279d VG STATE: active PP SIZE: 16 megabyte(s) VG PERMISSION: read/write TOTAL PPs: 542 (8672 megabytes) MAX Lvs: 256 FREE PPs: 431 (6896 Megabytes) LVs: 9 USED PPs: 111 (1776 megabytes) OPEN LVs: 8 QUORUM: 2 TOTAL PVs: 1 VG DESCRIPTORS: 2 STALE PVs: 0 STALE PPs:
14、0 ACTIVE PVs: 1 AUTO ON: yes MAX PPs per VG: 32512 MAX PPs per PV: 1016 MAX PVs: 32 LTG size (Dynamic): 256 kilobyte(s) AUTO SYNC: no HOT SPARE: no BB POLICY: relocatable 输出 说明 : ( 1) 主要指标为 PP size 和 Free PPs 。 ( 2) 通过查看 Free PPs项可以了解该 VG还有多少空间可以使用。 Free PPs PP size就是 VG剩余空间的大小。 如果 Free的 PP个数与 Total
15、 PP个数相比已经非常小,说明空间已经不足,如果该 VG内容会不断增长,请及时增加 VG的大小 综合监视命令 topas 监控方式 : 通过 topas 命令报告选定的本地系统活动的统计信息。该命令使用 curses 库以合适的格式来显示其输出,该格式适合于在一个 80x25 基于字符的显示 器上或至少同样大小的图形显示器的窗口中进行查看 。 操作示例 : #topas 输出示例 : 输出 说明 : 使用 topas命令 可以对 CPU,网络, IO,进程等很多方面进行监控,并输出到屏幕上。 输出结果只能通过显示屏实时显示,无法导出。 ( 1) CPU。 最左上显示 CPU的使用情况, Use
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 主机 存储 设备 性能 监控 方案
