Ps:切掉的新書已更新過章節內容不可能放這本,沒那麼喪心病狂,只是搜尋引擎名字引用了「靈境搜尋」,因為想了幾個名字都覺得沒這個合適,現在人工智慧和GPT那麼熱,正好2013年是生物識別技術和神經網路開始爆發的年頭,本來AI的劇情就是從本書大綱挪過去,不在本書展開,新書嘎了,那邊也還沒展開,所以調整回來,但已經更新了的章節內容是絕對不會發第二次。
——
陳宇說到這裡順手關掉了會議大螢幕的PPT,轉而看向眾人說:「AI語言大模型的建構,後面的一大工作重點就是資料投餵,底層演算法架構雖然不是基於自然語言處理NLP,但毫無疑問也受其影響,接下來的資料投餵首先是把網際網路上已有的公開資料截止2012年之前產生的存量資料資訊都給我爬一遍,國內國外的都要爬。」
這等於是白嫖全人類千百年來所積累的絕大部分知識。
一位與會的工程師詢問道:「每天大約要爬取多少資料量?」
陳宇言簡意賅:「5個PB左右。」
5個PB?
眾人都是一陣驚愕,5個PB的資料量換算一下就是500多萬GB的資料量,網際網路巨頭谷歌在2008年每天處理的資料量大約是20個PB左右,相當於是其四分之一的資料處理量。
這是一項大工程,而且超級消耗算力資源,換句話說就是燒錢啊,光是網費就要一大筆開支。
陳宇轉而說道:「此外,叟狗搜尋開發新版本大更新,新版本推出之後更名為靈境搜尋,等到使用者完全適應習慣了,叟狗搜尋這個名字就棄掉。」
新版本上線初期,叟狗搜尋的名字還是會保留的,使用者若是輸入叟狗搜尋引擎的時候會跳轉顯示為靈境搜尋,並且要有標記這是改名後的叟狗搜尋。
告訴老使用者,叟狗還是那個叟狗,名字改了而已。
現在肯定不能直接用靈境搜尋這個名字,那會丟掉好多老使用者,叟狗這個名字還是需要保持一段時間的,等靈境搜尋的知名度和影響力覆蓋了叟狗就可以徹底放棄這個名字。
此時此刻,旁聽的方鴻翹著個二郎腿一言不發的聽著。
陳宇繼續道:「對於新版本靈境搜尋,簡而言之就是,更簡潔、更精準、更舒適。靈境GPT成熟的那天便會接入靈境搜尋,這是顛覆當代搜尋引擎的一大重要倚仗。」
「也許顛覆百渡乃至谷歌的可能不是靈境搜尋,但毫無疑問的是,AI技術的進步必然會改變人們訪問資訊的方式。」
「而我所想象的方式是,瀏覽器的搜尋欄被人AI取代,在我輸入時,AI會自動完成我的想法或問題,同時給我提供最佳答桉,這個答桉可能是一個網站或產品的連結,AI用舊的搜尋引擎後端來收集相關資訊和連線,然後為我匯總。」
「這種顛覆方式就在於像是讓一個專業的研究人員來做這項工作,只不過AI會立刻完成,而人類需要花費數分鐘乃至更久才能完成。」
使用者自己去搜尋內容的時候,還得去篩選、尋找,有時候非常耗時,而如果有AI的幫助就不一樣了,直接問AI即可,它馬上秒秒鐘就給使用者提供最佳答桉。
想要達到這種效果,那就需要超級龐大的算力資源,以及AI足夠「聰明」或者說能夠更加精準的理解人類的「語言」才能提供精準的答桉。
顯而易見,首先就需要讓AI把人類千百年來積累的知識都掌握了。
先去把那些資料爬一遍再說,這是能夠針對任何使用者提出的任何問題並快速給出精準答桉的前置條件之一。
此刻,陳宇看著眾人說道:「眾所周知,搜尋廣告透過關鍵