關燈 巨大 直達底部
親,雙擊螢幕即可自動滾動
第一百二十六章 老不正經傑姆斯?

這位小哥的言行吸引到了不少人的目光,他那自信且流暢的書寫動作,讓蘇飛也覺得是不是真是一個特立獨行的天才。

懷著一絲期待和一絲好奇,蘇飛認真地看著這位小哥的模型結構和證明過程。

簡而言之就是瘋狂做減法。

變形金剛由六個編碼器和六個解碼器組成,每個編碼器和解碼器裡又分為多頭注意力層、歸一化層和線性層等等,這位小哥直接把六個解碼器全砍了,編碼器也砍了五個,剩餘的一編碼器裡把裡邊各層也砍了好幾個……<……雖然你說你的想法很簡單,但這也簡單得太過分了……

蘇飛終於忍不住了:“冒昧地問一句,你做過實驗麼?”

“實驗?噢,bro,為了趕這次ac,我加班加點,實在沒時間,但我保證我的這個結構是有效的,因為經典的eo預訓練模型也是這種簡單的單層結構!”

小主,這個章節後面還有哦,請點選下一頁繼續閱讀,後面更精彩!<o的確也是瘋狂做減法,但eo模型和注意力機制有個毛線關係?<o模型抄一半,再把變形金剛抄一半,組合成自己的論文?

特麼的!抄的左一篇右一篇全是我的論文!

“或許你不瞭解變形金剛的設計意義,之所以這樣重複性地疊加編碼器和解碼器是為了獲取更高層次的特徵,這個是由作者本人多次實踐得出的結論,大幅度削減這些結構會讓訓練結果非常不穩定,eo的單層結構是因為作者在建模之初只有一個命名體識別任務,不需要提取更高階的特徵向量……”

換而言之,這倆模型一人一半的結果就和大量水遇上活潑金屬直接劇烈爆炸一樣。

圍著這位小哥的懂行的學者也不禁點了點頭,蘇飛說的也是把變形金剛預訓練化的難點,當然,大部分不做這一塊的學者或者一些純粹跟著導師來參觀的路人就不太理解了。<o沒有這麼脆弱,變形金剛也沒有那麼複雜。”小哥眉頭一挑,說道:“在我看來,沒有什麼比eo和變形金剛更合適的了,這一點連創造他們的作者本人都沒有理解透徹,只能為他感到多麼遺憾。”

蘇飛聳了聳肩,行吧,你說啥就是啥,俺也懶得反駁了,純屬浪費時間。

正當蘇飛想要隨意敷衍兩句就走人的時候,一個本來在圍觀的白人老外走到了自己面前,一臉驚異地看著自己。

“fei su?”

嗯?

蘇飛疑惑地看著眼前的這個一身休閒服的老外,大約四五十歲的年紀,頭髮卻是一個爆炸頭,看上去有些老不正經。

“您好?”

蘇飛禮貌地打著招呼。

<o的原作者,蘇飛?”

這看上去老不正經教授的一句話讓臺上正津津樂道的韓國小哥動作一僵,直接凝固在當場。

隨後,蘇飛輕輕的點頭承認,更是讓韓國小哥一哆嗦,記號筆直接掉到了地上。

圍觀學者們眼神一亮,他們有些興奮,變形金剛的貢獻有目共睹,而創造這個模型的更是一個傳奇——一個小小的本科生,親眼見到這位天才,讓學者們多少有些雀躍。

而且,如果能和這位天才好好交流交流,說不定就能抓住一縷不錯的靈感。

“傑姆斯教授,您怎麼在這?”

一個華裔青年迅速小跑過來,氣喘吁吁的。

傑姆斯?

臥槽,蘇飛心裡一驚。

這位就是那個敢和曼寧教授一較高下的羅切斯特大學的傑姆斯?

但怎麼看著不像呢……一頭爆炸頭,配上有點非主流的休閒服,如果別上一個電子吉他,都能直接去做搖滾了啊。

傳聞羅切斯特大學計算機系人人聞風喪膽的傑姆斯,怎麼是一個這麼不正經的老頭。

蘇飛感覺自己的三觀崩塌了。

大老的畫風怎麼是這樣?

“傑姆斯教授,久仰大名。”