第十四章 圖片比對(duì)算法
晚上的派對(duì)舉辦的很成功,氣氛非常濃厚。
商務(wù)白領(lǐng)們放下了平日的嚴(yán)謹(jǐn)和肅穆,程序員也沒(méi)有想象中那么不善交際。
加盟奧創(chuàng)的四個(gè)人也很受歡迎,大家都是在為同一個(gè)老板打工,業(yè)務(wù)范圍也不一樣,而且將來(lái)避免不了交叉合作,提前熟悉一下,對(duì)雙方都有好處。
王正拿著一瓶啤酒坐在角落悠閑的慢慢喝著,今晚他足足炒了三大鍋小龍蝦……真是有點(diǎn)兒累。
謝莉爾端著一杯雞尾酒走過(guò)來(lái)坐在他身旁,道:“賈斯汀,感覺(jué)怎么樣?”
拿起酒瓶跟謝莉爾輕輕碰了一下:“非常好。謝謝你雪莉,是你讓Meta成長(zhǎng)的這么快?!?p> 謝莉爾輕輕抿了一口,笑道:“是這里每一個(gè)人的功勞,尤其是你,否則我們不會(huì)擁有這么輕松愉快的工作?!?p> 王正謙虛了一下:“我只是更被命運(yùn)眷顧而已?!?p> 謝莉爾怔了一下,說(shuō)道:“時(shí)間差不多了賈斯汀,提一杯祝酒詞吧。”
王正點(diǎn)點(diǎn)頭,拿起啤酒走到場(chǎng)地中央,大喊了一聲“祝酒”,音樂(lè)漸消,人們的目光都聚集了過(guò)來(lái),看著自家的老板。
王正環(huán)視了一圈,最終高舉啤酒喊道:“為了創(chuàng)造一個(gè)奇跡!干杯!”
三十多人齊齊的喊道“創(chuàng)造一個(gè)奇跡”,大笑著跟旁邊的人互相碰杯。
大約10點(diǎn)左右,派對(duì)正式結(jié)束。
員工們自發(fā)的將派對(duì)用的物品都整理好,紛紛告辭回家。
王正洗了澡躺在床上回想著,其實(shí)還挺有成就感。
不過(guò)越是融入,他就越是想念家鄉(xiāng),越是想念葉子同學(xué)。
睡不著,索性起床打開(kāi)電腦,登錄到國(guó)內(nèi)火云那邊的服務(wù)器上,給葉子發(fā)消息,順便處理今天的工作。
然后繼續(xù)學(xué)習(xí)。
經(jīng)過(guò)仿寫(xiě)瀏覽器之后,王正對(duì)于倉(cāng)頡語(yǔ)言已經(jīng)掌握的很熟練了。
但是熟練掌握不代表就能想要啥就寫(xiě)啥。
沒(méi)有經(jīng)過(guò)系統(tǒng)培訓(xùn)的人,給他源代碼可能都看不懂為什么要這么寫(xiě)。
這里面有個(gè)邏輯問(wèn)題。
比如王正知道人工智能,知道區(qū)塊鏈,知道深度學(xué)習(xí)算法,20年后誰(shuí)還不知道點(diǎn)兒這個(gè)。
但是他不可能寫(xiě)的出來(lái)——根本不知道怎么用代碼實(shí)現(xiàn)的。
這玩意兒真就是不知道就是不知道,蒙都沒(méi)地方下手。
瞎幾把一通亂寫(xiě),別說(shuō)人工智能了,大夏版Siri那種人工智障他都寫(xiě)不出來(lái)。
成長(zhǎng)是有的,起碼在經(jīng)過(guò)瀏覽器仿寫(xiě)的那段時(shí)間后,他終于明白了所謂的算法、代碼、程序之間的關(guān)系。
算法是解題步驟,代碼解題用的筆,程序是得出的結(jié)果,編程語(yǔ)言就相當(dāng)于那張紙。
他現(xiàn)在這情況就等于已經(jīng)知道答案,有紙有筆但是沒(méi)步驟,解不了題。
不過(guò)王正也沒(méi)想過(guò)一口吃個(gè)胖子,指望一個(gè)高中都沒(méi)上完純靠自學(xué)那點(diǎn)兒英語(yǔ),能看的懂一門(mén)高級(jí)語(yǔ)言就很不容易了。
更別說(shuō)就他那初中水平的數(shù)學(xué),放在二十年后連個(gè)小學(xué)孩子都教不了。
學(xué)學(xué)不會(huì),抄還不會(huì)嗎?
先甭管步驟是怎樣的,抄個(gè)100分出來(lái)比啥都強(qiáng)。
現(xiàn)在無(wú)論是火云還是Meta,迫切的急需圖片識(shí)別技術(shù)、圖片壓縮技術(shù)、包括視頻內(nèi)容識(shí)別技術(shù)和視頻壓縮技術(shù)。
圖片識(shí)別和視頻識(shí)別,目的是為了減少M(fèi)eta社區(qū)和小云書(shū)社區(qū)網(wǎng)站的內(nèi)容審核工作量,同時(shí)也能給用戶提高更好的體驗(yàn)。
目前,美聯(lián)這邊稍微好一些,沒(méi)那么夸張。但是國(guó)內(nèi)……一言難盡,比基尼都得屏蔽一下。
太低估大夏人民的心里承受能力了。
雖然社區(qū)現(xiàn)在還沒(méi)上視頻播放功能,但這個(gè)是遲早的,未雨綢繆,這是必須要做的。
圖片還好說(shuō),但是視頻識(shí)別真不太好解決。王正還記得一篇新聞,大概是逗音平臺(tái),有大約兩千人的視頻審核團(tuán)隊(duì)。
在國(guó)內(nèi)成本還好,在美國(guó)……實(shí)在太貴了。
還有圖片和視頻的壓縮技術(shù),同樣非常重要。
圖片越清晰,所占的體積肯定就越大,加載也會(huì)更慢。像Meta這種社區(qū),圖片越多,占用的存儲(chǔ)就越多,這是巨額的成本。
更別說(shuō)未來(lái)上了視頻,那需要的存儲(chǔ)更是天文數(shù)字。
讓王正自己解決問(wèn)題是不現(xiàn)實(shí)的,但是他有掛。
U盤(pán)里的軟件加倉(cāng)頡編譯器,能幫他直接得到解題步驟。
王正打開(kāi)U盤(pán),找到了《云網(wǎng)網(wǎng)吧管理系統(tǒng)》這個(gè)軟件。
這里面有一個(gè)程序,就是人臉比對(duì)模塊,當(dāng)初王正著手買來(lái)的。
人臉比對(duì)嘛,和照片對(duì)比相比,已經(jīng)是進(jìn)階版的技術(shù)了。
能搞定人臉比對(duì),照片比對(duì)還不是手到擒來(lái)?
所以他把人臉比對(duì)這個(gè)模塊拖進(jìn)了倉(cāng)頡開(kāi)發(fā)套件,很快,左側(cè)是程序運(yùn)行虛擬機(jī),右側(cè)是轉(zhuǎn)換為倉(cāng)頡語(yǔ)言的源代碼。
不管是什么語(yǔ)言寫(xiě)的程序,只要最終能被識(shí)別為機(jī)器語(yǔ)言,計(jì)算機(jī)就能理解并執(zhí)行。
理論上,倉(cāng)頡語(yǔ)言是能夠在win系統(tǒng)下運(yùn)行的。
不過(guò)王正還沒(méi)開(kāi)始學(xué)win系統(tǒng)的格式,但這影響不大。
將這個(gè)程序掛在到一個(gè)運(yùn)行鴻蒙系統(tǒng)的服務(wù)器上,要求網(wǎng)頁(yè)服務(wù)器把接收到的上傳照片,傳送到這個(gè)服務(wù)器上,經(jīng)過(guò)程序比對(duì),通過(guò)的就返回放行,通不過(guò)的就拒絕接收。
這個(gè)思路還是靠譜的。
至于說(shuō)數(shù)據(jù)量太大,那就多搞一些高性能服務(wù)器唄。
王正也沒(méi)偷懶,直接拿源代碼出去。這些東西終究是身外之物,知識(shí)才是自己的。
多學(xué)點(diǎn)兒,虧不了。
依舊是仿寫(xiě),但是速度快了很多。
而且隨著這種模仿,編程到底是一個(gè)什么樣的邏輯,王正的認(rèn)知會(huì)越來(lái)越透徹。
三十多萬(wàn)行代碼,王正越寫(xiě)就越清醒。
哪些代碼分析人臉位置,哪些代碼提取人臉特征,哪些代碼用于圖片比對(duì),哪些代碼用于輸出結(jié)果。
光是這些,就足以讓王正受益無(wú)窮。
別的不說(shuō),這里面每一項(xiàng)都可以生成一個(gè)專利,兩兩組合,三三組合,至少可以申請(qǐng)下來(lái)二三十項(xiàng)專利。
就人臉識(shí)別這個(gè)技術(shù),光專利授權(quán)都?jí)虺砸惠呑拥摹?p> 而且有后人智慧結(jié)晶在手,他不用再重復(fù)造車輪子,開(kāi)發(fā)新技術(shù)時(shí)用得到就直接套用,省去了大量的時(shí)間。
一直肝到清晨,實(shí)在是肝不動(dòng)了,這才關(guān)掉顯示器,順利入眠。
后面,還有很多種先進(jìn)算法在等著他呢。