老趙那邊非常利索地把伺服器的賬號密碼發了過來,順便還非常貼心地把江大自己開發的伺服器登入器也發了一個過來。
蘇飛按照inux系統的操作命令,先登陸上去看了看配置,這不看不知道,一看嚇一跳。
老趙分給他的這臺伺服器插了四張顯示卡,清一色的3080ti,蘇飛查了下型號,這一張就得近萬,而作為核心與這四張顯示卡協同運算的cpu那就更了不得了。
他不由得有些感嘆,老趙啊老趙,你年輕的時候是得多大牛,這都退居二線了,手裡還富得流油。
蘇飛敢打包票,就這四張3080ti的配置,就能抵得上江大不少教授實驗室的資源了。
不過這四張卡有兩張已經在運作了,估計是其他學生申請了學校的伺服器,在跑實驗。
既然有了這種配置,蘇飛也算是有底氣了,他根據自己的模型單元構建起了一個模型結構,然後挑選了人工智慧領域中非常典型及複雜的任務,機器翻譯。
其實就是語言翻譯,目前為止使用的各種翻譯軟體其核心技術就是基於機器翻譯。
這其實還是自然語言處理領域,但又不侷限於自然語言處理,因為機器翻譯是公認的大資料訓練,其訓練的複雜度和圖領域不相上下,這也就代表著這個實驗任務能在很大程度上反應論文模型在人工智慧領域的效能。
而蘇飛思前想後,決定採取現在國際上公認的兩個機器翻譯標準任務,將英語翻譯成德語以及法語的t任務,這兩個翻譯任務是目前最有說服力的實驗,現在甚至有一個實時榜單專門對這兩個任務打榜,在人工智慧領域幾乎無人不知無人不曉。
所以,蘇飛要在最有公信力的任務上下手,做到一擊斃命。
在他熬夜修仙兩天後,終於辛辛苦苦把自己的模型構建出來了,但應用到這倆任務上去時,他卻傻眼了。
“臥槽,這訓練一輪就得半小時?”
要知道,人工智慧領域的訓練輪數都是1000次打底,像機器翻譯這種2000次都是常態的。
“這起碼得4、50天才能訓完啊……”
這簡直就離譜,一篇論文耗時最長的居然是任務訓練,而最為核心的模型構建只花了幾天時間。
而且,在訓練中途出了啥岔子,比如說有其他同學一不小心佔用了他這張顯示卡的計算資源,導致程式崩潰,他的模型資料一旦沒儲存下來,那就得重新訓練。
還有一個很重要的問題是,萬一訓練出來的效能沒有想象中的好,蘇飛還得調節引數,再訓練一次,這時間跨度就未免太長了。
蘇飛思考良久,只得又去找vx裡的那個中年禿頭大叔。
【老趙,能不能再給我臺伺服器。】
【咋滴了,剛給你的那臺伺服器出啥岔子了?】
【顯示卡有些不夠用。】
【要幾張顯示卡。】
蘇飛想要在一週左右訓練完,這麼一算……
【8張3080ti。】
那邊發來一個小企鵝頭掉了的表情包。
【你當我是提款童子?前天不剛讓你給我低調點?!】
【那6張也行。】
兩三週以內也能接受哇。