AIX巡检报告以及操作手册 - 范文中心

AIX巡检报告以及操作手册

11/24

巡检内容及操作指导

1. IBM RS6000小型机机房要求:

1.        机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。

2.        温度(摄氏 ℃)

10 ℃-40℃

湿度(%)

8% -80%

2.        设备故障灯分类:

主机故障灯

面板上不能有数字显示,如果有的话,说明系统有故障。

FAStT700磁盘阵列故障灯

告警灯为黄色表示有故障

磁带机故障灯

告警灯为黄色说明有故障或磁带机太脏,须清洗。

3.        系统错误报告(Error Log)的检查:

硬件故障检测命令:# errpt -d H -T PERM

若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析结果报告给客户

软件故障检测命令:# errpt -d S -T PERM

若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析结果报告给客户

4.        有否发给root用户的错误报告(mail):

#mail

1.        观察所有未读消息,注意有关diagela的消息。

2.        常用命令:

h []               Display headings of group containing message

t []          Display messages in or current message.

n                       Display next message.

q                       Quit

3.        对发现的问题详细分析,结果报告给客户

5.        文件系统的检查:

命令:

# df –kP

%Used为文件系统的使用率。所有文件系统的使用率不能大于80%

6.磁带机清洁的检查:

命令:

#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n

显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。

6.        通信系统的检测:

1.        网卡的状态

命令:

#ifconfig –a

输出判断:

en0: flags=7e080863

inet 192.168.1.3 netmask 0xffffff00 broadcast 192.168.1.255

主备网卡的flag为UP属正常。同时检查ip地址和netmask是否正确。

2.        路由的检测

命令:

#lsattr –El inet0

hostname      shaixsvr Host Name                        True

gateway                Gateway                          True

route                  Route                            True

bootup_option no       Serial Optical Network Interface True

rout6                  FDDI Network Interface           True

authm         65536    Authentication Methods           True

3.        网络的检测

命令:

#ping [ip address]

输出判断:

用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。

RAID 的Hotspare 属性是否打开

#smitty ssaraid? Change/Show Attributes of an SSA RAID Array

检查Enable Use of Hot Spares属性是否为YES

8.系统DUMP设置的检查

命令:

#sysdumdev –l

输出判断:

结果应为

primary              /dev/hd6

secondary            /dev/sysdumpnull

copy directory       /var/adm/ras

forced copy flag     TRUE

always allow dump    FALSE

dump compression     OFF

若不正确请用下列命令修改:

#sysdumdev –P –p /dev/hd6 –s /dev/sysdumpnull

9.HACMP 配置检测: Cluster Verification:

命令:

# /usr/sbin/cluster/diag/clconfig -v ‘-tr‘

输出判断:

结果无Fail项输出。

10.系统硬件诊断:

命令顺序为:

1.#diag

2.Enter

3.Diagnostic Routines

4.System Verification

5.All Resources

6.F7

输出判断:

结果应为No trouble was found.

11.补丁程序(PTF)的检查

1.        系统维护补丁版本为ML05,检查命令为:

#instfix –i |grep ML

12.系统参数的检查

1.HIGH water mark for pending write I/Os

# lsattr -El sys0 |grep maxpout

输出判断:

结果应为

maxpout     33      HIGH water mark for pending write I/Os per file   True

2.LOW water mark for pending write I/Os

# lsattr -El sys0|grep minpout

输出判断:

结果应为

minpout     24      LOW water mark for pending write I/Os per file    True

更改命令为:

#chdev -l sys0 -a maxpout=‘33‘ -a minpout=‘24‘

3.Syncd参数

# grep syncd /sbin/rc.boot

输出判断:

结果应为

nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &

更改命令为:

#vi /sbin/rc.boot

4.aio参数

# lsdev -Cc aio

输出判断:

结果应为

aio0 Available  Asynchronous I/O

# lsattr -El aio0

输出判断:

结果应为

minservers 1         MINIMUM number of servers                True

maxservers 10        MAXIMUM number of servers                True

maxreqs    4096      Maximum number of REQUESTS               True

kprocprio  39        Server PRIORITY                          True

autoconfig available STATE to be configured at system restart True

fastpath   enable    State of fast path                       True

更改命令为:

#smitty aio

5.Limits文件的设置:

#ulimit –a

输出判断:

结果应为

time(seconds)        unlimited

file(blocks)         2097151

data(kbytes)         262144  //尤其是这项参数

stack(kbytes)        32768

memory(kbytes)       32768

coredump(blocks)     2097151

nofiles(descriptors) 2000

更改命令为:

#vi /etc/security/limits

更改data为524288


相关内容

  • 服装QC岗位职责
    qc岗位责任制 岗位名称:qc检验员 报告对象:qc检验室负责人 岗位目标: 1 完成分管范围的产品检验工作,保证检验结果的准确.真实. 2 遵守公司质量管理方面及检验室的各项规定,保证检验工作的安全及检验室的清洁. 岗位职责: 1 qc检 ...
  • 公司质量控制管理制度
    广东********有限公司 文件名称: 质量控制管理制度 文件编号: 版 本 号: 受控状态: 分 发 号: 编制日期: 审批日期: 实施日期: 编制: 审核: 批准: 质量控制管理制度 (一).制订产品质量检验标准,健全质量管理流程. ...
  • 爱岗敬业的工人标兵
    1972年出生在普通工人家庭的刘万里,受父辈的影响和熏陶,从小就对工厂有一种特殊的感情,立志长大成为一名技术顶呱呱的好工人.1991年9月,刘万里高中毕业被招聘进入大连西太平洋石化公司,担任重油加氢制氢联合装置操作员,2003年生产一区成立 ...
  • 安全生产制度手册
    安全生产标准化制度手册 编制: 审核: 批准: 2015年6月3日发布 2015年6月7日实施 目录 安全生产管理制度发布令 ................................... 3 安全生产责任制 ........... ...
  • 设备维保服务合同
    设备维保服务合同 合同编号: 甲 方: 地 址: 邮政编码: 联 系 人: 电 话: 传 真: 乙 方: 地 址:: 邮政编码: 联 系 人: 电 话: 传 真: 开户银行: 银行账号: 根据<中华人民共和国合同法>相关法律法规 ...
  • 加油站管理经验
    加油站管理经验 方法一:抓反复.反复抓 事物的反复性告诉我们,抓工作不可能"毕其功于一役",必须反复抓.抓反复.提高执行力首先要落实在经常抓.具体抓.反复抓上.实践证明,凡落实比较好的工作一般都不是一次到位,而需要反复努 ...
  • 机房维护合同书
    机房维护合同书 为了提高甲方故障应急处理能力及维护水平,及时发现安全隐患.减少网络故障的发生.提高网络系统管理水平.确保机房工作环境正常,由乙方___________________ 为甲方 提供机房维护服务,经双方友好协商,达成以下合同条 ...
  • 四种操作系统的区别
    LINUX 特点 基本思想 Linux 的基本思想有两点:第一,一切都是文件:第二,每个软件都有确定的用途.其中第一条详细来讲就是系统中的所有内容都归结为一个文件,包括命令.硬件和软件设备.操作系统.进程等等.对于操作系统内核而言,都被视为 ...
  • 工艺事故事件管理规定
    工艺事故事件管理规定 1 1.1 术语和定义 工艺事故 因工艺操作失误.巡检不到位.故障处理不及时.技术整改方案落实不力, 造成停产.减产或产品质量问题等称为工艺事故. 1.2 工艺事件 凡因操作失误,维护不周,操作不当等各种原因,已构成事 ...
  • 项目部五大员工作手册7-18
    湖北中卫建设工程有限公司 项目部五大员工作手册 一.施工员: 每日应该完成的工作: 1.熟悉相关施工图纸和各类合同,学习施工规范和专项施工方案,督促和检查各分包班组是否按照图纸.合同内容.规范.施工方案施工. 2.提前做好并落实施工进度布署 ...