看门狗,又叫watchdog timer,是一个定时器电路,一般有一个输入,叫喂狗(kicking the dog/service the dog),一个输出到MCU的RST端,MCU正常工作的时候,每隔一段时间输出一个信号到喂狗端,给 WDT清零,如果超过规定的时间不喂狗(一般在程序跑飞时),WDT定时超过,就会给出一个复位信号到MCU,使MCU复位。防止MCU死机. 看门狗的作用就是防止程序发生死循环,或者说程序跑飞。
二、基本原理:
看门狗是一种监控系统的运行状况的手段,通过软硬件结合的方式实现对系统运行状况的监控。稳定运行的软件会在执行完特定指令后进行喂狗,若在一定周期内看门狗没有收到来自软件的喂狗信号,则认为系统故障,会进入中断处理程序或强制系统复位。系统上电后根据不同的工作模式可以选择使能看门狗的时机,若看门狗被使能则计数器开始计数,如果在设定的时间内没有及时喂狗则会发生看门狗超时。看门狗主要由寄存器、计数器和狗叫模块构成:通过寄存器对看门狗进行基本设置,计数器计算狗叫时间,狗叫模块决定看门狗超时后发出的中断或复位方式。
三、分类:
3.1硬件看门狗:
硬件看门狗是利用了一个定时器,来监控主程序的运行,也就是说在主程序的运行过程中,我们要在定时时间到之前对定时器进行复位。如果出现死循环,或者说PC指针不能回来,那么定时时间到后就会使单片机复位。常用的WDT芯片如MAX813,5045,IMP 813等。
3.2软件看门狗:
而在某些情况下,也会采用纯软件的方法来设置看门狗,如在单片机系统中,利用闲置的定时器/计数器就可以设计一个软件看门狗。具体实现步骤如下:
首先,在初始化程序中设置定时器/计数器的方式以控制寄存器(TMOD) 和定时时间的初值,并且打开中断。然后,根据定时器的时间,在主程序中按一定的时间间隔插人复位定时器的指令(喂狗), 两条喂狗指令之间的时间间隔可以根据系统时钟与指令周期计算出来,而且该时间周期应该小于定时器的定时时间。最后,在定时器的中断服务程序中,设置一条无条件转移指令,将程序计数器PC转移到初始化程序的入口。
在非单片机系统,如PowerPC系统中,也可以采用多线程的方式来设置软件狗,其主要的步骤如下所述:
首先,新建一个看门狗线程,该线程维护一个全局变量数组,该数组相当于每个工作线程的计数器。看门狗线程为一一个死循环,每隔一段时间就会循环一次,并将全局变量数组的每一个值都加1后判断是否超过预定义的上限值,若发现某个线程对应的变量数值超过最大值,则看门狗线程会重置该线程。
然后,每个工作线程中,每隔一段时间就会将对应的全局变量置0 (喂狗)。软件看门狗的优点是无需额外的硬件支持,但当系统存在严重的错误时(例如:中断服务出错),则有可能导致软件看门狗失效。
四、屏蔽方法:
看门狗的存在虽然使得程序变得更加健壮,但在某些时候它的存在会使的我们很困扰,例如在想要逆向分析调试ECU上的程序时,看门狗的存在成了我们不得不面对的一道难题,为了使得ECU能够调试起来就必须屏蔽掉看门狗。
由看门狗的原理可知,看门狗最终的输出信号时作用到MCU的RST引脚的,所屏蔽的核心就是如如何断开外部信号和MCU的RST引脚的联系。此处以汽车ECU的看们狗电路为例。
4.1、找基础芯片:
汽车ECU中硬件看门狗,通常集成在电源管理芯片,通信转换芯片等此类基础芯片中。(如TLE9263BQX、NVC8518B、UJA113X)该类芯片中均存在一个引脚控制着看门狗,需要做的就时按照该芯片的数据手册描述对该引脚进行拉高或拉低即可屏蔽看门狗电路)。
4.2、找外围复位电路:
对于一些ECU中看门狗不存在基础芯片中,而是由晶振、电阻、电容等电子元器件组成,对于此类看门狗的屏蔽方法就只能通过分析电路走线了,将于MCU中RST引脚相接的电阻或电容断开,该电阻、电容大概率出现在有晶振存在的区域,该类的看门狗屏蔽比较复杂,基本上时通过排除法来尝试的。
4.3、提供外围干扰信号
对于那些即找不到基础芯片、有找不到外围看门狗电路的ECU,可以尝试通过外部给MCU的RST引脚一个拉高(RST通过一个小阻值的电阻接到电源上)或拉低(RST通过一个小阻值的电阻接到地上)的信号。该方法存在些许风险,请谨慎尝试。