【题解】洛谷 P2353 背单词

2023-12-20 13:04:55

原题链接:P2353 背单词

题目背景

小明对英语一窍不通,令老师十分头疼。于是期末考试前夕,小明被逼着开始背单词……

题目描述

老师给了小明一篇长度为 n n n 的英语文章,然后让小明背 m m m 个单词。为了确保小明不会在背单词时睡着,老师会向他提 Q Q Q 个问题,每次老师随机选择一个区间 [ l , r ] [l,r] [l,r],小明要回答在这段文字中他背过的单词总共出现过多少次。

输入格式

第一行两个整数 m , Q m,Q m,Q 如前所述。第二行为英语文章。接下来 m m m 行每行一个需要背的单词。接下来 Q Q Q 行每行一个询问,包含两个整数 l , r l,r l,r(含端点),即给定的文字区间。

输出格式

Q Q Q 行,对每个询问输出一行表示答案。

样例 #1

样例输入 #1
3 3
abcabcbc
abc
bc
a
1 3
6 7
1 8
样例输出 #1
3
0
7

提示

数据范围:

对于 30 % 30\% 30% 的数据, 1 ≤ n ≤ 1 0 3 , 1 ≤ Q ≤ 1 0 3 1\le n\le 10^3,1\le Q\le 10^3 1n103,1Q103

对于 60 % 60\% 60% 的数据, 1 ≤ n ≤ 1 0 5 , 1 ≤ Q ≤ 1 0 5 1\le n\le 10^5,1\le Q\le 10^5 1n105,1Q105

对于 100 % 100\% 100% 的数据, 1 ≤ n ≤ 1 0 6 , 1 ≤ m ≤ 10 , 1 ≤ Q ≤ 1 0 6 , 1 ≤ 1\le n\le 10^6,1\le m\le 10,1\le Q\le 10^6,1\le 1n106,1m10,1Q106,1每个单词的长度 ≤ N , 1 ≤ l ≤ r ≤ n \le N,1\le l\le r\le n N,1lrn

提示:数据较大,请大家尽量采取高效率的读入输出方法。

知识点

KMP 字符串匹配,前缀和。

思路

观察数据范围,我们发现 Q ≤ 1 0 6 , m ≤ 10 Q \leq 10^6, m \leq 10 Q106,m10

于是考虑枚举每个小明背过的单词 p p p,跑 KMP 后开一个数组 f i , j f_{i,j} fi,j? 记录原字符串 s s s 中模式串 p i p_i pi? 完全匹配且匹配位置 左端点 s s s 前缀 [ 1 , j ] [1,j] [1,j] 中的 p i p_i pi? 的个数。

不过接下来我们发现它不满足区间减法,也就是不能通过 f i , r ? f i , l ? 1 f_{i,r}-f_{i,l-1} fi,r??fi,l?1? 直接求出。

这是因为尽管 p i p_i pi? 左端点在区间 [ l , r ] [l,r] [l,r] 中,但不能保证右端点也在此区间中。

所以查询区间 [ l , r ] [l,r] [l,r] 的时候我们选择区间 [ l , r ? ∣ p i ∣ + 1 ] [l,r-|p_i|+1] [l,r?pi?+1] 以保证这个字符串完整地在区间 [ l , r ] [l,r] [l,r] 中。

预处理时间复杂度 O ( M ∑ i = 1 M ∣ p i ∣ ) O(M\sum_{i=1}^{M}|p_i|) O(Mi=1M?pi?),查询时间复杂度 O ( 1 ) O(1) O(1),可以接受。

代码

#include <iostream>
#include <cstring>

using namespace std;

const int N = 1000010;

int M, Q;
char p[N], s[N];
int ne[N], cnt[N];
int f[11][N];

inline void get_next(char *p)
{
    int n = strlen(p + 1);
    memset(ne, 0, sizeof ne); // 多测需要清空
    for (int i = 2, j = 0; i <= n; i ++ )
    {
        while (j && p[i] != p[j + 1]) j = ne[j];
        if (p[i] == p[j + 1]) j ++ ;
        ne[i] = j;
    }
}

inline void kmp(int id, char *s, char *p)
{
    int n = strlen(p + 1), m = strlen(s + 1);
    for (int i = 1, j = 0; i <= m; i ++ )
    {
        while (j && s[i] != p[j + 1]) j = ne[j];
        if (s[i] == p[j + 1]) j ++ ;
        if (j == n) f[id][i - j + 1] ++ ; // 如果完全匹配则在左端点为 i - j + 1 的位置 + 1
    }
}

int main()
{
    scanf("%d%d", &M, &Q);
    scanf("%s", s + 1);
    int m = strlen(s + 1);

    for (int i = 1; i <= M; i ++ )
    {
        scanf("%s", p + 1); // 读入每个模式串 p
        get_next(p); // 处理 p 的 next 数组
        kmp(i, s, p); // KMP 并处理 f 数组
        cnt[i] = strlen(p + 1); // cnt 记录 p 的长度
        for (int j = 1; j <= m; j ++ )
            f[i][j] += f[i][j - 1]; // 前缀和
    }

    int l, r;
    while (Q -- )
    {
        scanf("%d%d", &l, &r);
        int res = 0;
        for (int i = 1; i <= M; i ++ )
            if (r - cnt[i] + 1 > l - 1) // 当且仅当左端点最晚出现位置在 l - 1 之后才计入答案
                res += f[i][r - cnt[i] + 1] - f[i][l - 1];
        printf("%d\n", res);
    }

    return 0;
}

文章来源:https://blog.csdn.net/xingchen_2008/article/details/135104189
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。