“孫叔,現在還是儘量把這些人給拉進我們公司,至於高端顯卡的事情,可以通過相關渠道多購買一些。”
深度求索公司最主要研發人員包括梁文鋒、趙成鋼、吳俁等。
但是深度求索的背後其實是一家實力非常強悍的公司成立的,這家公司就是幻方量化。
所以對於一些關鍵的人物,比如梁文峰,周末並沒有把他的名字寫在上麵。
但是深度求索這家公司其實是在2023年成立的,距離現在還有很長一段時間。
很多人此時還沒有加入這家公司,所以周末這個時候讓孫堅去邀請他們加入星海科技是絕對沒有問題的。
而且星海科技本身智能駕駛技術就非常強悍,對於ai大模型有著天然的優勢。
如果不是幻方量化目前並不缺錢,周末還準備直接把這家公司給收購了,這樣對於星海科技來說其實是最好的。
孫堅表示明白,周末提供的名單上隻有一些,這些人的名字和一些基本信息。
這還是周末苦思冥想後才想出來的,這些人具體的情況還需要孫堅去調查後才能夠知道。
孫堅也知道,目前星海科技和貝萊德公司的關係比較微妙。
目前高端顯卡雖然沒有被阿美莉卡注意到,但是如果星海科技這個時候直接購買顯卡,肯定會被貝萊德公司注意到甚至針對,不讓星海科技購買。
阿美莉卡沒注意到顯卡的原因,最主要原因是目前的顯卡在大模型訓練的不可替代性沒有暴露出來。
或者說,現在進行大模型訓練的公司,使用的顯卡有限,特彆是在大模型方麵還沒有特彆大的突破,以及證據表明訓練大模型需要特彆多的顯卡。
就算在前世,英偉達的市值狂飆到1萬億美元,也是2020年的事情。
市值突破到2萬億,已經是2024年的時候了。
而現在,英偉達的市值還處於1400億美元左右。
就算是大家經常吐槽的隻會搞放貸的阿狸公司,市值都比英偉達這家公司高。
從這裡就可以看出來,英偉達目前的確並不太被重視。
“周總,訓練大模型需要的顯卡數量應該不少,一下子買的太多應該有些困難。”
孫堅知道所謂的特殊渠道,不過就是加價從其他公司購買,或者讓第三方去購買罷了。
他剛才在劉旭那裡也了解了,訓練合適的,可以讓所有人都使用的大模型,肯定需要非常多的算力來支持。
東大每年購買的顯卡數量也都差不多,如果短時間內出現大量波動,導致接下來一個月購買的顯卡數量是之前的好幾倍,隻要不是傻子,都會知道有問題。
所以,孫堅對周末說的表示一些擔憂。
周末笑著說道:“孫叔,目前可以緩慢購買一些顯卡,數量上儘最大的努力就可以,等什麼時候買不到了再說。”
周末之所以讓孫堅去邀請這些人,主要還是前世的深度求索需要的算力成本非常低,對於顯卡的數量要求不是特彆巨大。oe)可將推理成本降至傳統模型的110。a)使128k長文本處理顯存占用僅為行業標準的13。
fp8混合精度訓練讓訓練速度提升50的同時保持模型精度。
其deepseekv3模型以較低訓練成本達到gpt4級彆的性能表現。
2024年12月26日,deepseekv3首個版本上線並開源,以低成本訓練出性能超越gpt4o的大模型,震驚業界。
2025年1月20日發布deepseekr1模型,性能比肩openaio1正式版。
一下子就打破了阿美莉卡製造的謊言,甚至一度使得英偉達的股價下跌超過四分之一。
可以說,深度求索推出的deepseek對西方國家的打擊是巨大的,讓他們的謊言也不攻自破。
接著,孫堅和劉旭就開始去準備了。
與此同時,互聯網上又席卷來了一場波瀾。
……
王原吸煙的新聞瞬間衝上了熱搜,隻要打開互聯網軟件,第一個出現的就是這個。
可以說,如果沒有人在後麵推波助瀾,肯定不會這樣。
對此,東大政府也是睜一隻眼閉一隻眼,每隔一段時間都有明星塌房,他們也習慣了。