RHEL5故障一般排错(2)

2.进入急救模式,从备份文件中恢复 grub.conf 文件,
向MBR扇区中重建GRUB程序

sh-3.1# chroot /mnt/sysimage
sh-3.1# cd /boot/grub/
sh-3.1# cp grub.conf.bak grub.conf
sh-3.1# grub-install /dev/sda

(3)etc/inittab文件丢失
故障原因:
inittab文件被误删除,或者存在配置上的问题
故障现象:
one:启动中提示 “... INIT: No inittab file found”


two:系统停滞,无法完成初始化

解决方案:
One:进入急救模式,从备份文件中恢复
two: 在急救模式中重新安装 initscripts 软件包
rpm -ivh --aid --force --replacepkgs initscripts-8.45.14.EL.i386.rpm

(4)etc/fstab文件丢失
故障原因:
fstab文件被误删除,或者存在配置错误
故障现象:
one:启动中提示 “... /etc/fstab: No such file or directory”


two :系统停滞,无法完成初始化

解决方案:
one :进入急救模式,手动查找并挂载根分区
查找逻辑卷:lvm vgscan
激活指定的逻辑卷:lvm vgchange -ay /dev/VolGroup00
two :恢复或重建fstab配置文件


(5)忘记root用户的密码
故障原因:
忘记root用户的密码

故障现象:
one :无法进行需要root权限的管理操作
two :若没有其他可用帐号,将无法登录系统

解决方案:
one :引导进入单用户模式(runlevel=1),然后重设密码
grub > kernel ... single 或 s 或 1
two :进入急救模式,然后重设密码


(6)软件包类故障 —— rpm数据库损坏

故障原因:
非正常关机、误删除运行中的程序文件
RPM数据文件被误写或删除

故障现象:
不能正常查询rpm包信息 rpm -ql ; rpm -qa .....
无法安装、升级或卸载软件包等 rpm -U ; rpm -i......
解决方案:
重建RPM数据库
重建命令:rpm --rebuilddb 或 rpm --initdb


(7)磁盘资源耗尽故障

故障原因:
one :磁盘空间已被大量的数据占满,空间耗尽
two :虽然还有可用空间,但文件数i节点耗尽

故障现象:
one :无法写入新的文件,提示“… : 设备上没有空间”
two : 部分程序无法运行,甚至系统无法启动

解决方案:
1. 清理磁盘空间,删除无用、冗余的文件
2 .转移或删除占用大量i节点的琐碎文件
3. 进 入单用户模式、急救模式进行修复
4.用户设置磁盘配额---系统管理中必做的


2.11.1、排除故障的原则
?当发生问题时,系统只会显示当前的症状,而不会提示问题出在哪里

?所以只能尽量收集证据,来定义系统到底发生了什么问题

?除了收集资料外,还要定义好系统里有哪些功能可以正常运行

?相问资料收集完成后,我们才能假设可能发生问题的原因是什么

?可以查看日志文件来证明是不是某个系统发生了问题

?如果要修改配置文件,那么修改前最好先备份

2.11.2、X界面故障时,排除故障的流程
?当X界面故障时,千万不能在runlevel5下排除故障

?要在runlevel3的环境中排除故障

#vi /etc/inittab #修改id:5:initdefault为id:3:initdefault。

?执行system-config-display命令,看看能不能显示图形界面的显示器设置工具

?如果不能显示,表示问题可以出现在显卡,那我们可以:

#X -probeonly #检测显卡

依据/etc/X11/xorg.conf的设置测试能否启动X服务器,检测结果记录在/var/log/Xorg.0.log

?如果显卡没有问题的话,则检查/home和/tmp和/var目录是不是满的

?如果以上都不是,可以查看xfs服务有没有启动

#service xfs status #查看xfs服务的状态


2.11.3、网络故障时,排除故障的流程
?首先确认是不是名称解析出了问题

#dig hostname

?是不是IP或者网卡的问题

#ifconfig #查看网卡的设置和网卡的IP地址

?若网卡正常,还有正确获取IP地址,则可能是Default gateway(网关)不正确

#route –n #列出系统里所有的路由记录

?如果以上设置都正确,则看看内核里是否载入了网卡驱动

#cat /etc/modprobe.conf #查看是否载入网卡驱动

在这个文档中,可以确定是否载入了正确的网卡驱动,并确认网卡有没有对应到eth开头的别名

?如果以上都不是,则重新启动网卡,看看有没有错误提示

#ifdown eth0 #停用网卡

#ifup eth0 #启动网卡

在正常情况下,无论是停用或是启动,系统都不会提示任何信息

2.11.4、开机故障时,排除故障的流程
?首先查看是不是开机管理程序出了问题

?在RHEL4中,会使用GRUB当作默认的开机管理程序

?接下来确认有没有正确的载入内核

?开机时发生panic,则表示根目录没有挂载成功

?检查/sbin/init设置有没有错误

?检查/etc/inittab设置有没有错误

?并且检查根目录有没有损坏

?如果/etc/rc.d/rc.sysinit执行不成功,则有可能是

?/bin/bash文件损坏

?/etc/fstab设定有误

?都不是以上问题的话,则检查/etc/rc.d/rc文件

?检查/etc/rc.d/rcn(1-6).d有没有问题

2.11.5、文件系统故障时,排除故障的流程
?文件系统故障,通常是因为电脑宕机或不正常关机

?当文件系统故障时,先卸载文件系统

?#fsck –y 来测试指定的文件系统

?当文件系统修复后,再挂载文件系统

#fsck 可以用来测试并修复Linux的文件系统

修复文件系统(全程文字记录)

[root@CentOS ~]# umount /home #卸载文件系统

[root@CentOS ~]# ls /home #查看目录是不是空的,确定是否被卸载

[root@CentOS ~]# fsck -y /dev/sda8 #检查并修复文件系统对应的文件

fsck 1.39 (29-May-2006)

e2fsck 1.39 (29-May-2006)

/home: clean, 31/130560 files, 32156/522080 blocks

[root@CentOS ~]# mount /dev/sda2 /home #挂载修复完成的文件系统

[root@CentOS ~]# ls /home #查看是否修复成功

apache lost+found soft tmail tmail_v4.5.1_release.tar www

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/25527.html