字符串模式匹配之KMP算法图解与 next 数组原理和实现方案

日期：2022-09-01 栏目：程序人生浏览：次

之前说到，朴素的匹配，每趟比较，都要回溯主串的指针，费事。则 KMP 就是对朴素匹配的一种改进。正好复习一下。

KMP 算法其改进思想在于：

每当一趟匹配过程中出现字符比较不相等时，不需要回溯主串的 i指针，而是利用已经得到的“部分匹配”的结果将模式子串向右“滑动”尽可能远的一段距离后，继续进行比较。如果 ok，那么主串的指示指针不回溯！算法的时间复杂度只和子串有关！很好。

KMP算法的关键是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的，很自然的，需要一个函数来存储匹配失败的信息。

先理解一个概念：前后缀字符串

比如"ababa"

前缀：a，ab，aba，abab，除了最后一个字符

后缀：a，ba，aba，baba，除了第一个字符

比如"abcd"

前缀：a，ab，abc

后缀：d，cd，bcd

图解kmp 算法对朴素匹配改进的过程；

同样如图1，发生不匹配，朴素的做法是 j 到开头1出，i 到上次开始比较的位置的下一位2处（i回溯）

字符串模式匹配之KMP算法图解与 next 数组原理和实现方案

　图1　　　

字符串模式匹配之KMP算法图解与 next 数组原理和实现方案

但是发现一个问题，那就是在图1的3处，不匹配的时候，前面的字符已知是匹配的，ab 是模式串里临时匹配的串，如果 i 回溯，那么等于是白白去比较，因为要把"搜索位置"移到已经比较过的位置，重比一遍。无用功，如果此时 i 不动，直接就可以减少无用的比较次数（所谓无用是说以最少的比较次数，找出完全的匹配串，尽量少做不匹配比较，通过之前的信息来计算和判断），如上图2，i 不动，j 回溯到1，匹配，ij继续走……一直都是匹配的，直到图4

字符串模式匹配之KMP算法图解与 next 数组原理和实现方案