“不麻煩的,最多耽誤五分鐘,我引導您提交一些資料就行。”
“那行吧。”
……
十分鐘後,寧為看著認證過後的微博,終於想好了措辭。
“我是寧為,剛看到整件事情,感謝大家的信任與支援。想說點什麼,又不知道說什麼好!那就給大家拜個早年吧!祝大家新的一年快樂能單調遞增,煩惱是高階無窮,好運連續且可導,理想一定洛必達!”
沒去試圖解釋什麼。
因為寧為發現根本沒有必要,所有基於邏輯跟理性的判斷,大家已經都幫他說了,再去解釋自己沒說那些話,有些畫蛇添足了。
而且紀子珩那條最新宣告已經論述了事情的前因後果,他在說一遍也沒了什麼意義。
就這樣,挺好的!
做完這些,他便關了微博,長出了口氣,開始下載今天實驗室最新上傳的實驗資料,繼續做各種記錄跟比對,心情放鬆之下突然來了靈感,開始將所有異常資料歸類,然後按照今天靈感爆棚時想到的一種數學方法進行堆疊。
很快,寧為似乎從這些紛雜的資料中找到了規律。
終於他在無數紛雜的資料中找到了一個個異常值,再次歸類,寧為發現所有這些找出的異常資料在一定情況下,滿足正態分佈特點。
這次終於有眉目了。
對比資料的特點,寧為終於發現所有發生錯誤的資料同時指向演算法迴歸部分的一個問題。
湍流演算法在讀取異常資料流的時候需要經過多層判定,並對初篩出的疑似爬蟲或惡意連線訊號做出一個預標記,並匯入自己的資料庫,進行下階段的資料比對。
比如最淺層的對不合規瀏覽器頭,或者包含了爬蟲資訊的瀏覽器頭的判定,以及對某類ip一定時間內訪問次數的判定等……
而在數以億次的處理正常連線請求之後,記錄下當資料對流時產生的資料特徵,再跟資料庫內異常資料進行比對,嘗試放入,再比對,發出驗證碼,再比對,這一過程中,最後反饋給演算法的是資料流的異常特徵碼,對符合異常特徵碼的訊號進行標記,而不是標記具體的ip。
問題就出在這裡,在某次次遞迴過程中,極少數正常的請求在比對並自動記錄特徵碼的過程中,反饋時出了異常,這就導致同一類特性的資料全部被系統錯誤判定。
這個時候就體現出文件做得足夠細緻帶來的好處了。
找到了實驗室測試誤判率無法降低的原因所在,修改了思路,然後只需要查閱文件,很快便精準的找到了需要修改的部分。
程式設計快搶手的絕對是名不虛傳。
只花了三個小時,寧為便將程式更新完畢,然後傳回了實驗室。
雖然時間已經比較晚了,但他還是又給餘興偉打了個電話。
“喂,餘哥!”
“小寧總,還有什麼吩咐?”
剛才兩人已經透過電話,再打過來肯定有事。
“我剛才把湍流演算法重新更新了一下,發到實驗室裡了,明天你去處理一下,重新第二輪測試。”
“嗯?”
餘興偉愣了愣,隨後由衷的說道:“小寧總,我服了你了,今天這麼多亂七八糟的事情,你竟然還有心情改程式碼。”
“嗯,亂七八糟的事的確有點多,這不是我還沒反應過來,就解決了嗎?”
聽起來真心很有道理的樣子,直讓餘興偉羨慕嫉妒恨。
“小寧總,你身上又多了一條讓我崇拜的特質。”
“額?有嗎?”
“有啊,您真會凡爾賽!”
寧為:“……”
……
魯東義昨晚就到了江城,然後在江城休息了一晚,第二天搭乘最早的一班高鐵來到郾城。
所以寧為一大早便要趕到火車站去接人。
這次寧為吸取了經驗,把自己包裹的很嚴實。