模式匹配是指给定主串t和子串s,在主串t中寻找子串s的过程,其中s称为模式。如果匹配成功,返回s在t中的位置,否则返回-1。
KMP算法用next数组对匹配过程进行了优化。KMP算法的伪代码描述如下:
1.在串t和串s中,分别设比较的起始下标i=j=0。
2.如果串t和串s都还有字符,则循环执行下列操作:
(1)如果j=-l或者t[i]=s[j],则将i和j分别加1,继续比较t和s的下一个字符;
(2)否则,将j向右滑动到next[j]的位置,即j=next[j]。
3.如果s中所有字符均已比较完毕,则返回匹配的起始位置(从1开始);否则返回-1。
其中,next数组根据子串s求解。求解next数组的代码已由get_next函数给出。
【C代码】
(1)常量和变量说明
t,s:长度为lt和Is的字符串
next:next数组,长度为ls
(2)C程序
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
/*求next[]的值*/
void get_next(int*next,char*s,int ls){
int i=0,j=-1;
next[0]=-1;/*初始化next[0]*/
while(i<ls){/*还有字符*/
if(j==-1l ls[i]==s[j]){/*匹配*/
j++;
i++;
if(s[i]==s[j])
next[i]=next[j];
else
Next[i]=j;
}
else
j=next[j];
}
}
int kmp(int*next,char*t,char*s,int lt,int Is)
{
Int i=0,j=0;
while(i<lt&&(1)){
if(j==-1||(2)){
i++;
j++;
}else
(3);
}
if(j>=ls)
return(4);
else
return-1;
}
【问题1】(8分)
根据题干说明,填充C代码中的空(1)~(4).
【问题2】(2分)
根据题干说明和C代码,分析出kmp算法的时间复杂度为(5)(主串和子串的长度分别为lt和ls,用O符号表示)。
【问题3】(5分)
根据C代码,字符串“BBABBCAC”的next数组元素值为(6)(直接写素值,之间用逗号隔开)。若主串为“AABBCBBABBCACCD”,子串为“BBABBCAC”,则函数Kmp的返回值是(7)。
正确答案及解析
正确答案
解析
【问题1】
(1):j<ls;
(2):t[i]==s[j];
(3):j=next[j];
(4):i-ls+1或其等价形式;
【问题2】
O(It+Is)
【问题3】
(6):[-1,-1,1,-1,-1,2,0,0],(7)6。
【问题1】
本题问题1根据KMP算法的伪代码描述进行推导。
根据伪代码中第2步可以推导(1)是判断字符串s是否还有字符,即j<ls。i表示字符串t的下标,j表示字符串s的下标。
根据伪代码第2.1步可以推导(2)是判断字符串t和字符串s当前位置的字符是否相同,即t[i]==s[j]。
根据伪代码第2.2步可以推导(3)是当第2.1步判断条件不满足时,改变j所指向的字符位置。即j=next[j]。
根据伪代码第3步可以推导(4)是返回匹配的起始位置。由于当前i所指向字符串中匹配子串的最后一个字符的位置,且已知子串的长度为ls。(4)的代码为i-ls+1或其等价形式。
【问题2】
本题问题2是计算KMP算法的复杂度。算法的复杂度一般考虑最坏情况,那么在子串读到ls及主串读到It的时候是最坏情况。所以复杂度是O(It+Is)
【问题3】
本题问题3中已知字符串“BBABBCAC”,则根据get_next()函数可以求得next数组的元素值为[-1,-1,1,-1,-1,2,0,0]。并计算得到起始位置为6。
代入字符串“BBABBCAC”到get_next函数。
void get_next(int*next,char*s,int ls){
int i=0,j=-1;
next[0]=-1;/*初始化next[0]*/
while(i<ls){/*还有字符*/
if(j==-1l ls[i]==s[j]){/*匹配*/
j++;
i++;
if(s[i]==s[j])
next[i]=next[j];
else
Next[i]=j;
}
else
j=next[j];
}
}
这里涉及的只是代码的代入分析过程,注意循环的处理即可。
下面将循环过程依次代入数值并且写作顺序处理过程如下:
传参:s[]={B,B,A,B,B,C,A,C},ls=8,next[]数组只声明未取值。
初始化:i=0,j=-1,next[0]=-1。
while(i<ls)执行后面的循环体,即当i<8时执行循环。
(1)当i=0,j=-1时:
判断if(j==-1||s[0]==s[-1]),满足条件1执行下一步:i++=1,j++=0。
判断if(s[1]==s[0]),满足条件执行下一步next[1]=next[0]=-1。
【此时i=1,j=0】
(2)当i=1,j=0时:
判断if(j==-1||s[1]==s[0]),满足条件2执行下一步:i++=2,j++=1。
判断if(s[2]==s[1]),不满足条件执行else下一步next[2]=j=1。
【此时i=2,j=1】
(3)当i=2,j=1时:
判断if(j==-1||s[2]==s[1]),不满足条件1和2执行else下一步:j=next[1]=-1。
【此时i=2,j=-1】
(4)当i=2,j=-1时:
判断if(j==-1||s[2]==s[-1]),满足条件1执行下一步:i++=3,j++=0。
判断if(s[3]==s[0]),满足条件执行下一步next[3]=next[0]=-1。
【此时i=3,j=0】
(5)当i=3,j=0时:
判断if(j==-1||s[3]==s[0]),满足条件2执行下一步:i++=4,j++=1。
判断if(s[4]==s[1]),满足条件执行下一步next[4]=next[1]=-1。
【此时i=4,j=1】
(6)当i=4,j=1时:
判断if(j==-1||s[4]==s[1]),满足条件2执行下一步:i++=5,j++=2。
判断if(s[5]==s[2]),不满足条件执行else下一步next[5]=j=2。
【此时i=5,j=2】
(7)当i=5,j=2时:
判断if(j==-1||s[5]==s[2]),不满足条件1和2执行else下一步:j=next[2]=1。
【此时i=5,j=1】
(8)当i=5,j=1时:
判断if(j==-1||s[5]==s[1]),不满足条件1和2执行else下一步:j=next[1]=-1。
【此时i=5,j=-1】
(9)当i=5,j=-1时:
判断if(j==-1||s[5]==s[-1]),满足条件1执行下一步:i++=6,j++=0。
判断if(s[6]==s[0]),不满足条件执行else下一步next[6]=j=0。
【此时i=6,j=0】
(10)当i=6,j=0时:
判断if(j==-1||s[6]==s[0]),不满足条件1和2执行else下一步:j=next[0]=-1。
【此时i=6,j=-1】
(11)当i=6,j=-1时:
判断if(j==-1||s[6]==s[-1]),满足条件1执行下一步:i++=7,j++=0。
判断if(s[7]==s[0]),不满足条件执行else下一步next[7]=j=0。
【此时i=7,j=0】
(12)当i=7,j=0时:
判断if(j==-1||s[7]==s[0]),不满足条件1和2执行else下一步:j=next[0]=-1。
【此时i=7,j=-1】
(13)当i=7,j=-1时:
判断if(j==-1||s[7]==s[0]),满足条件1执行下一步:i++=8,i=ls,退出while循环。
next[]数组下标从0到7,结果分别为:[-1,-1,1,-1,-1,2,0,0]
包含此试题的试卷
你可能感兴趣的试题
一台主机的IP地址为202.123.25.36,掩码为255.255.254.0。如果该主机需要在该网络进行直接广播,那么它应该使用的目的地址为( )
-
- A.202.123.25.0
- B.202.123.25.255
- C.202.123.24.0
- D.202.123.24.255
- 查看答案
在计算机系统的日常维护工作中,应当注意硬盘工作时不能__(2)__。另外,需要防范病毒,而__(3)__是不会被病毒感觉的。
-
- A.电子邮件
- B.硬盘
- C.U盘
- D.ROM
- 查看答案
有 4 个 IP 地址:201.117.15.254、201.117.17.01、201.117.24.5 和 201.117.29.3,如果子网掩码为 255.255.248.0,则这 4 个地址分别属于3个子网;其中属于同一个子网的是()
-
- A.201.117.15.254 和 201.117.17.01
- B.201.117.17.01 和 201.117.24.5
- C.201.117.15.254 和 201.117.29.3
- D.201.117.24.5 和 201.117.29.3
- 查看答案
在异步通信中,每个字符包含1位起始位、7位数据位、1位奇偶位和1位终止位,每秒钟传送200个字符,采用4相位调制,则码元速率为()。
-
- A.50波特
- B.500波特
- C.550波特
- D.1000波特
- 查看答案
在 Windows 中,运行( )命令得到下图所示结果。以下关于该结果的叙述中,错误的是( )。
Pinging 59.74.111.8 with 32 bytes of data:
Reply from 59.74.111.8: bytes=32 time=3ms TTL=60
Reply from 59.74.111.8: bytes=32 time=5ms TTL=60
Reply from 59.74.111.8: bytes=32 time=3ms TTL=60
Reply from 59.74.111.8: bytes=32 time=5ms TTL=60
Ping statistics for 59.74.111.8:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 3ms, Maximum = 5ms, Average = 4ms
-
- A.该命令使得本地主机向目标主机发送了 4 个数据包
- B.本地主机成功收到了目标主机返回的 4 个数据包
- C.本地主机与目标主机连接正常
- D.该命令用于查看目标主机的 IP 地址
- 查看答案