首页
登录 | 注册

磁盘阵列问题导致宕机的一个案例

 

1.     情况描述

服务器在宕机后,不能正常启动,经过一些常规的domino检查和调整后,也是不能正常启动Domino服务器。服务器在启动的时候,只能出现软件的版本说明,还不能进入正常的启动进程。如下显示图:

#########################################################

Lotus Domino(r) Server, Release 6.5.4 FP2May 14 2005

CopyrightcIBM Corporation 19872005. All Rights Reserved.

#########################################################

在以下提示出现后,紧接着就服务器宕机的提示。

因为Domino服务器在正常使用的情况下,突然宕机,而且覆盖安装domino服务器也不能正常启动。

2. 原因分析

出现这种严重的宕机事故,根据经验,我们按照常规步骤,检查了服务器的配置信息:

1、检查操作系统补丁和软件补丁的安装情况。发现操作平台Solaris的补丁是按照Domino6.5.4的要求已经安装的,Domino的平台的补丁也是安装到最新的FP2

2、检查服务器的Notes.ini文件,没有发现特殊的参数。

3、检查服务器文档也没有发现服务器的一些异常的配置。

    

我们采取以下紧急排查步骤:

1、             替换Names.nsf数据库,再启动Domino服务器,因为这个数据库是Domino数据库的核心数据库,Domino启动的时候,需要依靠这个数据提供参数;

2、             把服务器的notes.ini文档的ServerTask后面的所有服务临时删除,再启动测试,这是因为服务器启动的时候,需要启动routerhttpamgr等一些服务进程,如果是某个服务有故障、有可能这些服务器会引起服务器的宕机。

3、             重新创建mail.box数据库,再启动domino服务器,因为这个数据库也是在服务器启动的时候,自动加载的。

4、             重新创建admin4.nsf数据库,因为这个数据库也是服务器启动的时候,自动加载的,是管理服务请求的一个关键数据库。

 

通过这些常规的处理方式之后,服务器在启动的时候还不能正常启动。

也就是不能进入到一个进程“event monitor started”不能启动log日志功能,这是domino启动的时候,第一个需要启动的服务。

产生的nsd如下:

##############################################################

prog: /opt/lotus/notes/65040/sunspa/server pid(s) : 681

======== Attaching to /opt/lotus/notes/65040/sunspa/server 681

###################################

###### thread 1/1 :: server, pid=681, lwp=1, tid=1 ######

###################################

[1]  ff29c718 nanosleep (ffa4f2c0, ffa4f2b8)

[2]  fda0f4b0 OSRunExternalScript (ffa4f84a, fed6433b, ffa4fc18, ffa4fbec, 800, 125c00) + 1dc

[3]  fda0da04 OSFaultCleanup (10000, 0, 0, 0, fd000000, 10000) + 21c

[4]  fd9e9d84 fatal_error (a, ffa502f8, 29c00, 29d40, fee8f824, 0) + 1a0

[5]  ff175bac __sighndlr (a, ffa502f8, ffa50040, fd9e9be4, 0, 0) + c

[6]  ff16f804 call_user_handler (a, ffa502f8, ffa50040, 0, 0, 0) + 234

[7]  ff16f9b4 sigacthandler (a, ffa502f8, ffa50040, ff2bc000, 81010100, ff0000) + 64

[8]  --- called from signal handler with signal 10 (SIGBUS) ---

[9]  ff29a13c readdir64_r (be13d6b7, ffa50440, ffa5043c, ff2982ec, 81010100, ff00) + 20

[10]  ff29a294 readdir_r (be13d6b7, ffa50b0c, ed, cfee, 29400, ee) + c

[11]  fda23b9c OSDirectoryScan (fda239d4, fef91a5c, fa2a0cb4, fa2a0ec6, fa2a10c8, fa2a0fc6) + 184

[12]  fe14a71c DbDirManRefreshDirectory (0, c001, ffbeea10, ffbee910, ffbee810, ffbee710) + a0

[13]  fe14a778 DbDirManRefreshDirectory (0, c001, ffbeea10, ffbee910, ffbee810, ffbee710) + fc管理员在2009年8月13日编辑了该文章文章。

-->
阅读(1424) | 评论(0) | 转发(0) |
0

上一篇:最近碰到的sso的问题

下一篇:Whats New in Notes 8


相关文章

  • 网上赌博被黑第三方出款通道维护不给出款怎么办?
    遇到被黑总体有两种处理方法: 一.自助,需要有一定电脑基础和技术,首先保持冷静不要与客服冲突,且不经意表达自己的经济实力.其次多打流水,输回盈利,在少盈利或不盈利的情况下提款.在者就是系统卡分,把分值卡到网站系统上面,让网站看到玩家账号的余 ...
  • 本文描述了一则因网络问题导致的cics交易中间件异常的处理方法与思路,如有问题欢迎随时交流~ 一.问题描述: 10月25日,柜面网关 系统 报ctg报错: 10/25/15 03:16:02.775 [9300] TRN:CCL9126E ...
  • 微软承认累积更新问题导致部分Slow用户无法升至Build 18362
    在声明中写道:"在过去数周,Slow 通道的 Windows Insider 成员已经开始接收 Windows 10 19H1 的版本更新以及累积更新.在上周五面向 Slow 通道发布 Build 18362 之后,Insider ...
  • 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://blog.chinaunix.net/uid-10915175-id-3195739.html 网站架构案例精解:http ...
  • 我们的线上web服务器在访问量很大时,就会出现网络连接丢包的问题,通过dmesg命令查看日志,发现如下信息: kernel: ip_conntrack: table full, dropping packet. kernel: printk ...
  • 解决因为sql server 存储过程导致的问题
    上周我维护的一个.net的网站出现问题了,查看详情时一旦这个详情页涉及到200个用户以上就会出现,200个以下就没有问题 我这两天抽空检查了代码,发现代码里使用的是存储过程只需动态SQL 我把.net代码里执行的sql语句手动逐一执行,发现 ...

2020 unjeep.com webmaster#unjeep.com
12 q. 0.013 s.
京ICP备10005923号