LeetCode 1316. Distinct Echo Substrings (RK哈希)

题意:

给一个字符串 寻找字符串为(a+a)格式的子串有多少。a+a 格式字符串比如 abcabc, ee 等。

首先O(N^2)枚举子串,然后通过哈希在O(1)复杂度判断子串是否符合要求。

RK哈希,Rabin_Karp 哈希,通过比较hash值是否相等来比较每个字符串是否相等。有概率出错(很小)

将字符串看做一个 n 进制的数字,通过一个大质数(如 1000000007 )取模,取得字符串的值。

这里使用无符号 64 位整数来存储哈希值,并通过 C++ 自然溢出的处理方式来取模。

因为有26个字母,选择27进制。注意一点是27进制,‘a‘不能被视为 0 否则 aa 和 a 就相同了。。。

代码:

class Solution {
public:
    int distinctEchoSubstrings(string text) {
        typedef unsigned long long ull;
        int n = text.size();
        int base = 27;
        vector<vector<ull>> h(n, vector<ull>(n));
        for (int i = 0; i < n; i++) {
            h[i][i] = text[i] - ‘a‘ + 1;
            for (int j = i + 1; j < n; j++) {
                h[i][j] = h[i][j - 1] * base + (text[j] - ‘a‘ + 1);
            }
        }
        set<ull> st;
        for (int i = 0; i < n; i++) {
            for (int j = 1; i + j * 2 <= n; j++) {
                if (h[i][i + j - 1] == h[i + j][i + j * 2 - 1]) {
                    st.insert(h[i][i + j - 1]);
                }
            }
        }
        return st.size();
    }
};

参考:

https://www.acwing.com/solution/leetcode/content/7499/