上課內容
這一週講隨機,主要講rolling hash,字串的hash、隨機的例題,像是矩陣乘法的驗證$O(n^2)$、訪問區間各元素出現次數是否為k的倍數,最近點對的$O(n)$作法等(還有東西還沒有看XD)
上機作業
欸迪的字串
題目連結
輸入有兩行,第一行包含一個長度介於[1,500000]的字串S,第二行包含一個長度介於[1,500000]的字串T,請輸出一串遞增的數列表示字串S出現在字串T的哪些地方。
Rolling hash:
我們如果假設我們要找的目標字串S,長度為m,他的雜湊值是:
則對於長度為L與r-1的字串T,其hash值為:
則目標區間長度為m的字串長度即為字串S的雜湊值,將T[1:L]的雜湊值扣掉$C^{m}$乘上T[1:r-1]的雜湊值,即為所求。
就可以得到當前區間的hash值
所以這整題就變成維護字串T的前綴和,透過以上方式O(n)得到每一個index的hash值,接著O(1)比對即可。
Q:照最基本的暴力比對可不可行?
A:可以構造出需要比對很多次的字串,有可能會被卡TLE之類的
以後一定要記得,必須要行末輸出一行,我在這邊WA超久
1 |
|
溫力的故事
題目連結
給字串集合A,接下來給m個字串,問你在m個字串中i字串一共出現了幾次。
直覺的想法就是直接用multiset來解這一題。
1 |
|
想不到題目標題QQ
題目連結
圖中的-2改成-(k-1),對於圖中的x,y都是設計成大數亂數,要承擔的風險就是這些大數相加之後不應該變成0的卻變成0(機率超小)
還有一個重點,對於每一筆詢問都要求出區間的和,因此要用O(n)維護前綴和!(一開始沒想到tle,不過靈光一閃維護前綴和就過了)
1 |
|
矩陣乘法
題目連結
給定三個矩陣ABC,驗證A乘上B是否為C。
當然可以用$O(n^3)$的時間實際驗證A乘上B的結果與C比對,但其實有更快的方法
如下,構造出矩陣R,這一題可以思考要1乘上多少的矩陣,透過兩次O(n^2)的乘法,就可以比對這個R矩陣乘上C矩陣的結果
這題蠻簡單的,一次就過了
1 |
|
最近點對
題目連結
大魔王題,害我TLE 27次。
二維平面,給定n個點,求出最近的兩個點的距離。
重大BUG害我卡三天的BUG在於,題目要求輸出距離的平方,結果在計算過程中就直接把距離當作是平方,自然有很多點會同時出現在一格網格座標中(我弱,一直TLE),還一直用什麼multi_map之類的,當然就是TLE嘍。
暴力做:$O(n^2)$,分治做:$O(nlogn)$,隨機做:期望$O(n)$,最慘$O(n^2)$
這一題的步驟:
- 把 N 個點平移到第一象限
- 把 N 個點的順序隨機打亂,d = dis(𝑎1, 𝑎2)
- 以 𝑟 = 𝑑/2 的大小將二維平面切成網格狀,並將這些網格也 𝑥𝑦
以座標表示:點(𝑥,𝑦)會落入座標為 (𝑟,𝑟)
不會有兩個點在同一個格子內(很重要的性質) - 一直把點加進網格中
如果產生新的最近點對一定會出現在以某個點為中心的5×5宮格內 - 找到更近的最近點對
更新 r= 新的最近點對 /2 ,回到步驟三重來 O(i+1)
期望複雜度 $O(n)$ 證明
考慮加入第i+1個點時出現新的最近點對,發生的機率為:在$C_2^{i+1}$個配對中跟i+1個點產生最近點對共有i種可能,因此機率為$\frac{2}{i+1}$,當機率發生的時候,必須將所有的點都刪掉重新來一遍(因為r變小,unordered_map裡面的東西也要被清空,重新推入i+1個點),需要付出$O(i+1)$的時間,相乘起來每一個點期望的複雜度為$O(1)$,因此總時間複雜度為$O(n)$。
實作上可以用unordered_map,因為保證不會出現同一格的情況(一格間的最長距離也就不超過d,所以當出現在同一格就表示該更新了)
優化:先用$O(n^2)$的作法,找到前面的少數pair($\sqrt n$)的最短距離,這樣可以減少被重新更新的機會
這篇文章有分治的作法,雖然分治的複雜度是O(n\log n),隨機是$O(n)$,但因為隨機常數比較大的關係,時間比分治慢了快兩倍!下圖是分治的執行結果:
以下是隨機AC Code:
1 |
|
手寫作業
不用交手寫作業!不過還是有一份「欣賞用」的,講Disjoint Set