2.进入急救模式,从备份文件中恢复 grub.conf 文件,
向MBR扇区中重建GRUB程序
sh-3.1# chroot /mnt/sysimage
sh-3.1# cd /boot/grub/
sh-3.1# cp grub.conf.bak grub.conf
sh-3.1# grub-install /dev/sda
(3)etc/inittab文件丢失
故障原因:
inittab文件被误删除,或者存在配置上的问题
故障现象:
one:启动中提示 “... INIT: No inittab file found”
two:系统停滞,无法完成初始化
解决方案:
One:进入急救模式,从备份文件中恢复
two: 在急救模式中重新安装 initscripts 软件包
rpm -ivh --aid --force --replacepkgs initscripts-8.45.14.EL.i386.rpm
(4)etc/fstab文件丢失
故障原因:
fstab文件被误删除,或者存在配置错误
故障现象:
one:启动中提示 “... /etc/fstab: No such file or directory”
two :系统停滞,无法完成初始化
解决方案:
one :进入急救模式,手动查找并挂载根分区
查找逻辑卷:lvm vgscan
激活指定的逻辑卷:lvm vgchange -ay /dev/VolGroup00
two :恢复或重建fstab配置文件
(5)忘记root用户的密码
故障原因:
忘记root用户的密码
故障现象:
one :无法进行需要root权限的管理操作
two :若没有其他可用帐号,将无法登录系统
解决方案:
one :引导进入单用户模式(runlevel=1),然后重设密码
grub > kernel ... single 或 s 或 1
two :进入急救模式,然后重设密码
(6)软件包类故障 —— rpm数据库损坏
故障原因:
非正常关机、误删除运行中的程序文件
RPM数据文件被误写或删除
故障现象:
不能正常查询rpm包信息 rpm -ql ; rpm -qa .....
无法安装、升级或卸载软件包等 rpm -U ; rpm -i......
解决方案:
重建RPM数据库
重建命令:rpm --rebuilddb 或 rpm --initdb
(7)磁盘资源耗尽故障
故障原因:
one :磁盘空间已被大量的数据占满,空间耗尽
two :虽然还有可用空间,但文件数i节点耗尽
故障现象:
one :无法写入新的文件,提示“… : 设备上没有空间”
two : 部分程序无法运行,甚至系统无法启动
解决方案:
1. 清理磁盘空间,删除无用、冗余的文件
2 .转移或删除占用大量i节点的琐碎文件
3. 进 入单用户模式、急救模式进行修复
4.用户设置磁盘配额---系统管理中必做的
2.11.1、排除故障的原则
?当发生问题时,系统只会显示当前的症状,而不会提示问题出在哪里
?所以只能尽量收集证据,来定义系统到底发生了什么问题
?除了收集资料外,还要定义好系统里有哪些功能可以正常运行
?相问资料收集完成后,我们才能假设可能发生问题的原因是什么
?可以查看日志文件来证明是不是某个系统发生了问题
?如果要修改配置文件,那么修改前最好先备份
2.11.2、X界面故障时,排除故障的流程
?当X界面故障时,千万不能在runlevel5下排除故障
?要在runlevel3的环境中排除故障
#vi /etc/inittab #修改id:5:initdefault为id:3:initdefault。
?执行system-config-display命令,看看能不能显示图形界面的显示器设置工具
?如果不能显示,表示问题可以出现在显卡,那我们可以:
#X -probeonly #检测显卡
依据/etc/X11/xorg.conf的设置测试能否启动X服务器,检测结果记录在/var/log/Xorg.0.log
?如果显卡没有问题的话,则检查/home和/tmp和/var目录是不是满的
?如果以上都不是,可以查看xfs服务有没有启动
#service xfs status #查看xfs服务的状态
2.11.3、网络故障时,排除故障的流程
?首先确认是不是名称解析出了问题
#dig hostname
?是不是IP或者网卡的问题
#ifconfig #查看网卡的设置和网卡的IP地址
?若网卡正常,还有正确获取IP地址,则可能是Default gateway(网关)不正确
#route –n #列出系统里所有的路由记录
?如果以上设置都正确,则看看内核里是否载入了网卡驱动
#cat /etc/modprobe.conf #查看是否载入网卡驱动
在这个文档中,可以确定是否载入了正确的网卡驱动,并确认网卡有没有对应到eth开头的别名
?如果以上都不是,则重新启动网卡,看看有没有错误提示
#ifdown eth0 #停用网卡
#ifup eth0 #启动网卡
在正常情况下,无论是停用或是启动,系统都不会提示任何信息
2.11.4、开机故障时,排除故障的流程
?首先查看是不是开机管理程序出了问题
?在RHEL4中,会使用GRUB当作默认的开机管理程序
?接下来确认有没有正确的载入内核
?开机时发生panic,则表示根目录没有挂载成功
?检查/sbin/init设置有没有错误
?检查/etc/inittab设置有没有错误
?并且检查根目录有没有损坏
?如果/etc/rc.d/rc.sysinit执行不成功,则有可能是
?/bin/bash文件损坏
?/etc/fstab设定有误
?都不是以上问题的话,则检查/etc/rc.d/rc文件
?检查/etc/rc.d/rcn(1-6).d有没有问题
2.11.5、文件系统故障时,排除故障的流程
?文件系统故障,通常是因为电脑宕机或不正常关机
?当文件系统故障时,先卸载文件系统
?#fsck –y 来测试指定的文件系统
?当文件系统修复后,再挂载文件系统
#fsck 可以用来测试并修复Linux的文件系统
修复文件系统(全程文字记录)
[root@CentOS ~]# umount /home #卸载文件系统
[root@CentOS ~]# ls /home #查看目录是不是空的,确定是否被卸载
[root@CentOS ~]# fsck -y /dev/sda8 #检查并修复文件系统对应的文件
fsck 1.39 (29-May-2006)
e2fsck 1.39 (29-May-2006)
/home: clean, 31/130560 files, 32156/522080 blocks
[root@CentOS ~]# mount /dev/sda2 /home #挂载修复完成的文件系统
[root@CentOS ~]# ls /home #查看是否修复成功
apache lost+found soft tmail tmail_v4.5.1_release.tar www