無論如何,易科的Q3財報在這個月十五號都要出爐了。
儘管心裡已經有預期,但親自走入暴風雨中的陸奇還是心神不寧,也免不了在心中自嘲,看客與當事人的感受終究不同,這份壓力還是受著了。
11月2日,上午11點,陸奇開完會接到了秘書的通知,方總中午請客。
等他抵達小食堂,聽到正在放著的音樂是《AllYouNeedIsLove》便不禁微微一笑,那篇由谷歌釋出《AttentionIsAllYouNeed》的名字就是來自披頭士的這首歌。
陸奇與埃爾德、吳恩達打了招呼,沒聊幾句就轉入了深度學習DL的話題,也就立即打起精神,講述自己更多的想法。
這兩位在易科都不簡單,一位總領研發範疇的事務,一位是深度學習的主要負責人,雖說自己算是空降組建深度學習事業部,但資源的分配和使用也需要相互的溝通。
陸奇能在微軟做到高位,自然不會輕視人事工作。
「谷歌那邊把自注意力機制的模型在論文裡命名為Transformer,我問了問,他們內部是在開發新的NLP模型了。」吳恩達談到上次業界探討後的變化。
吳恩達之前是斯坦福的副教授和人工智慧實驗室主任,而在加入易科前就在谷歌負責相關工作,與那邊的研究交流沒有中斷,上次的激辯同樣給他帶來不少靈感。
陸奇點點頭,也說著自己掌握的訊息:「業界對於Transformer的表現很認可,像去年成立的OpenAI,他們現在也在著手研發一款以Transformer為核心的大模型,乾脆直接以它命名,叫GPT,GenerativePretrainedTransformer。」
OpenAI是一家去年成立的公司,有不少領域內知名的人物參與。
方卓這時候簡單總結道:「難道谷歌的這個Transformer真就能超過RNN和CNN了?我們在這兩方面已經投入很多了。」
RNN是迴圈神經網路,CNN是卷積神經網路,易科的Siri是基於前者,太白則是基於後者。
同樣,業界在人工智慧領域的研究也主要是這兩個方向以及它們的變體,RNN能處理序列資料中的時間依賴性而廣泛應用於自然語言處理任務,CNN則因為它在影象識別和處理中的出色表現,成為計算機視覺領域的基石。
像易科的機器人Guard就使用了CNN在視覺方面的成果。
但現在,誕生於一場激辯中的第三個方向竟然隱隱有取代RNN和CNN的趨勢,這無疑會削弱易科在相關領域研究的優勢。
陸奇聽到方總這樣說,保持沉默,埃爾德也不出聲。
反倒是吳恩達笑了起來:「方總,在科學研究上,方向錯了,越努力就距離成功越遠,這一點從我最開始做科研就已經被事實教育過,RNN在處理長序列時遇到了梯度消失和爆炸的問題,這一點的突破一直很艱難。」
&ner模型有希望解決這個問題,並且已經表明它的並行處理能力和更高效的訓練特性,這就應該按照對的來。」
「我們投入的資源和精力並不能左右科學的正確答案。」
「答案就在那,我們只是用各種各樣的方式發現角落裡的它。」
「況且,RNN與CNN仍舊會在特定的場景下發揮作用。」
吳恩達不管是不是方總在試探自己的想法,先表明在科研上的立場。
方卓微微點頭,沉吟道:「其實,不瞞你們,陸總的到來給我很多新的思考,你們今天說的這個Trans
&ner,谷歌在做,OpenAI在做,好像大家一下子又認為這個方向可以創造很多新可能,既然真有希望,那我們在戰略上的定位是不是還需要修改。」
他說著自己這兩天在想的事情:「陸總還說了英偉達要賣鏟子的事,我現在回想,黃仁勳當時確實在現場很高興,和我聊過自注意力機制對GPU的促進,如果還要提高重視程度,那我們實際上在整個產業鏈上是能用出更多力氣的。」
「這馬上冰芯要收購中芯了,實際上,冰芯也已經在主導長電在封測領域的方向,如果英偉達可以賣鏟子,我們為什麼不可以賣?」
方卓說著自己考慮修正的方向。
陸奇剛要點頭,忽然反應過來,吃驚的說道:「冰芯要收購中芯了?」
方卓點點頭,確認自己說了這話。
陸奇陷入思考,按方總所說,冰芯不僅要收購中芯,還已經在國內封測領域有主導權,這樣再加上易科,儼然便是設計、製造、封測一條龍。
如果在未來兩年之內能解決光刻膠的問題,構建更大範圍內的軟硬體生態,這必然能帶來足夠的後勁。
他油然一嘆,嚴肅的說道:「方總,當務之急就是要恢復冰芯在先進製程上的製造能力啊。」
方卓「嗯」了一聲,想說點什麼又放棄了。
算了,都到這時候了,反正也快獻禮了。
反正,意思就是這個意思。
如果真如陸奇所說,真如吳恩達的思考,業界如谷歌和OpenAI等公司開始對新的模型充滿期望,那自己也有必要重新審視與英偉達的合作,重新思考要做的戰略調整了。
午餐越吃越沉默,方卓在思考未來,吳恩達在思考DL的三種方向,陸奇在思考產業鏈巨大整合所帶來的效果,埃爾德在思考研發團隊的整合。
等到這頓實際上達成一定共識的午餐結束,陸奇走之前又問了一句現在外界最關心的資訊:「方總,Q3財報是15號發了?」
方卓確定道:「是的,已經定了,史上最差Q3財報,你想看嗎?」