在給AI建立認知體系的系統(tǒng)工程中,語言處理已經(jīng)完成,黑科?太昊實驗室現(xiàn)在的工作是視覺部分。
說一句題外話,計算機視覺的發(fā)展可能超乎很多人的想象。
很早以前,在最權威的競賽ILSVR上,千類物體識別錯誤率2011年時高達25.8%,而次年深度學習出現(xiàn)以后,錯誤率逐年下降到16.4%、11.7%、6.7%、3.7%……16年,已經(jīng)遠低于人類。
最有商業(yè)前景的人臉識別,AI做到了誤判率低于百萬分之一!
這個比例,想必因為張學友演唱會,而被抓到的近百個逃犯,很有發(fā)言權了。
一首涼涼,哦不,鐵窗淚,可能就是他們的心情。
圖像識別高到ILSVR停辦,新的計算機視覺競賽ImageNet也從圖像識別,轉(zhuǎn)到圖像理解,物體分類、跟蹤、定位,場景識別等等。
但神經(jīng)網(wǎng)絡是在像素層面提取數(shù)學特征,可以精細區(qū)分人類注意不到的細節(jié),但在圖像理解,輪廓、形狀、物理和結構等難以定量描述的特征,往往容易被忽略。
這一類難度極高,識別準確率暫時Top-1不到87%,距離實際應用差得還遠[1]。
有機會進入黑科的實驗室工作,陸少英極度興奮,陳然給指定座位,“以后你就用這一臺吧,工作內(nèi)容我教你?!?p> 陸少英感覺機子很大氣,“這是什么電腦?”
一旁的錢斌樂了,“什么電腦,這是工作站!”
“工作站?”
“對?!标惾稽c頭,簡單說了一句,“我們對圖像處理的要求比較高?!?p> “戴爾PrecisionT950圖形工作臺?!标懮儆⒖戳艘谎坫懪?,又打開系統(tǒng)配置表,“4顆15核至強CPU,30線程,512G(ECC)內(nèi)存……”
“握草,性能爆炸??!”陸少英驚叫一聲,“這要是跑個游戲,還不得飛起來!”
“哈哈哈!”實驗室的小伙伴們都笑了起來,“大驚小怪!”
“淡定!丟人不?”陳然捂了把臉,陸少英絲毫不覺得,興奮道:“這么好的機器,不便宜吧?”
你是劉姥姥進大觀園嗎?陳然撇了撇嘴,“還好吧,79萬?!?p> 陸少英大吃一驚,李舒涵也是瞪目結舌,數(shù)一數(shù),1、2、3、4……實驗室一共有25臺?
光工作站將近兩千萬,真是壕,無,人,性!
等陳然講到工作內(nèi)容,陸少英又吃了一驚。
與深度學習的二維平面圖不同,太昊的訓練數(shù)據(jù)是3D視頻。比如一個街頭遠景,紅綠燈、十字路口,熙熙攘攘的人群,飛馳的汽車、高樓、藍天,視角可調(diào),處處是驚人的360度全景。
無盲點覆蓋所處場景的全景視頻,其實不新鮮,很多的監(jiān)控、地圖、VR就有應用,但給神經(jīng)網(wǎng)絡作為訓練數(shù)據(jù),卻十分罕見。
“二維的平面圖,不能讓太昊理解空間和結構?!狈椒ㄌ?,陳然只能解釋,“3D不同,有時間和因果關系……太昊可以像初生的嬰兒一樣,觀察真實世界。”
“全景區(qū)分、比對所有細節(jié),運算量是指數(shù)級暴增啊!”陸少英有專業(yè)素養(yǎng),瞬間感覺頭皮發(fā)麻,“可怕!你們的服務器配置要高到什么程度?”
陳然微微一笑,陸少英本來就是可造之材,有點眼力。
人機大戰(zhàn),AlphaGo戰(zhàn)勝世界圍棋冠軍,要用1202個CPU和176個GPU。全景的運算超過AlphaGo數(shù)個量級,算力需求更是極為龐大。
呆妞李舒涵還想見見稀罕,“服務器呢,在哪兒?”
實驗室的男生們生被她逗樂了,“神州超級計算機,找得著算你本事……”
李舒涵還是一臉懵圈,陸少英再次驚嘆,“不在這兒,在黑科科學院?!?p> 神州超級計算機由黑科并行計算工程技術中心研制,裝有61440塊自主研發(fā)的“神州1.0”眾核處理器,峰值性能18.6億億次/秒,持續(xù)性能15.3億億次/秒,造價57億!
都說大炮一響,黃金萬兩,論燒錢,AI毫不遜色。
良久才平復了心情,陸少英想起了什么,“這個神經(jīng)網(wǎng)絡,就是你早上的論文……“
“對,確實是新一代神經(jīng)網(wǎng)絡。”陳然淡淡一笑,“更充分的特征比對,可以全面模擬人腦思維,進而提煉通用智慧,叫做認知引擎。NLP只是它的部分應用,屬于一段?!?p> 新一代神經(jīng)網(wǎng)絡?!
認知引擎一段?
這恐怕是高級人工智能的核心技術吧,陸少英心馳神往,“如果,我是說如果,認知引擎進能進行圖像理解,甚至和語言結合起來……”
“這是認知引擎二段的內(nèi)容,建立一個完整的認知體系?!卞X斌哈哈一笑,“就像人類的嬰兒,太昊通過觀察真實世界,總結智慧通式,成為強智能!”
“電影里面一樣的AI?!”李舒涵張大小嘴,陸少英也懵逼了好幾秒,才吃力的咽了咽口水,“真的嗎?”
“差不多……”陳然摸了摸鼻子,承認了,只是隱藏了幾份腹黑。
陸少英說的沒錯,有了出自輔腦的認知引擎,強智能的誕生幾乎板上釘釘。
輔腦有全套的強智能理論,可以復現(xiàn)認知引擎的整個代碼,通過海量的數(shù)據(jù)訓練、參數(shù)調(diào)整、非監(jiān)督學習,建立完整的認知體系,迅速成為真正意義上的強智能!
但是陳然的《神經(jīng)網(wǎng)絡的結構細分和動態(tài)路由》,真的會講述它的奧秘?
呵呵……
天真!
在原來的時空,AI就像歷史上的煉金術、永動機一樣,前進的道路迷霧蒙蒙,黑燈瞎火,人類步履蹣跚、走錯方向,甚至摔跤,蹉跎了幾十年。
站在未來,陳然當然可以避過所有的大坑,抄一條近道!
但這個世界到處都是惑人的假象。
所謂兵不厭詐,陳然提供的正是一個精心制作的煙霧彈。
如果深信《神經(jīng)網(wǎng)絡的結構細分和動態(tài)路由》,一定要編程實現(xiàn)那么復雜而又吊詭的邏輯陷阱,就像陸少英一樣,怎么說呢?
原諒這是赤果果的科研競賽,黑科集團要甩開追兵,也要恰飯,萬一層出不窮的BUG坑死了哪個對手……
哎喲,真是抱歉!
太特么開心了。
讓陳然先笑三分鐘……
細數(shù)了一下所有的工作,陳然的準備工作基本完成,如果說差什么的話,后期強智能到真正意義的超級智能,就差一臺搭載專用“AI芯片”的超級計算機。
其實,相比已經(jīng)完成的認知引擎,芯片的難度才叫巨大。
CPU的物理架構并不擅長分布式并行計算,效率很低,目前使用最廣泛的GPU,正是因為在浮點運算、并行計算等部分,性能遠超CPU,達到數(shù)十乃至上百倍。
但這一切仍然不如通過指令集、物理結構調(diào)整,以硬件運行算法的專用AI芯片。
武裝到牙齒,才能戰(zhàn)無不勝。
把陸少英丟給錢斌,讓他先帶著,陳然就離開了實驗室。
滿以為可以和男神待一天,李舒涵心中的失落,幾乎都掛在臉上,“他去哪兒?”
實驗室里的一幫大齡直男聳了聳肩,“然哥忙著呢,誰知道?!?