KMP算法学习

2024-01-07 17:24:11

代码随想录-B站视频

KMP ：三位学者首字母，用于匹配字符串。

时间消耗：O(m+n)。

文本串：需要在其中查找模式串。

模式串：不匹配时，不会直接从文本串的下一个字符，而是直接跳到当前已经匹配好的串后继续匹配。

前缀表：一个字符串中每个字符的最长相等前后缀。

前缀：包含首字母，不包含尾字母的所有字串。

后缀：包含尾字母，不包含首字母的所有字串。

最长相等前后缀：

例子：aabaaf

a:是前缀没有后缀，0;

a : aa的长度是1；

b:aab长度是0；

a:aaba长度是1；

a:aabaa长度是2；

f:abaaf长度是0。

a至此得到前缀表：[0,1,0,1,2,0]。

过程：当f不匹配时，查找表发现，前一个位置对应的最长相等前后缀是2，这就是不相等了需要继续去匹配的字符串的位置，相等于跳到前缀的后面，这里就是继续去匹配b的意思。

next（prefix）数组：就是前缀表，表示遇见冲突后next数组会告诉我们需要回退到哪里。

（直接用前缀表就可以实现KMP算法，但是有的实现会进行一些转变）实现过程中会将前缀表进行减一或者右移一位，效果都是初始位置变为-1，后面整体右移或者减一，相当于变成[-1,0,1,0,1,2]或者[-1,0,-1,0,1,-1]。就像上面的在f发生冲突看的是前一位的前缀表，因此整体右移可以直接实现当前位置的匹配，减一个也是访问前一个位置的前缀表，然后再找的时候将这个1再加回来。

实现：循环不变量：遇见冲突看前一位。

next数组：

定义函数来求next数组，传入next数组，传入模式串
初始化next数组和函数中各个变量。需要一个指向前缀末尾位的j和指向后缀末尾位置的i，这里的j还代表了包括i在内的最长相等前后缀的长度。j=0；next[0]=0。
处理前后缀不相同的情况。从i开始进入循环遍历到模式串全部长度，i=1开始，因为i不能和j相等。比较当前的j和i，两者不相等时需要回退（不止一步，while），回退到前一位的前缀表对应的位置（相当于匹配时出现了冲突，j=next[j-1]，更仔细地说就是当前已匹配上的字串中（也就是当前已经匹配上的后缀中）可以不用再匹配的长度），回退到0停止( j!=0 and s[i]!=s[j] )。
处理前后缀相同的情况。s[i]=s[j]时相当于匹配上了，j需要加一，相当于匹配上一个。
更新next数组的值。最后更新next[i]=j。

文章来源:https://blog.csdn.net/weixin_44079186/article/details/135428498
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！