伊芙·卡莉現(xiàn)年25歲,是美國麻省理工學(xué)院計(jì)算機(jī)專業(yè)的一名博士。
事實(shí)上,一般的計(jì)算機(jī)專業(yè)學(xué)生很少有讀到博士的,基本上多數(shù)人讀完碩士就各奔前程了。
但伊芙·卡莉在學(xué)術(shù)的道路上有著屬于她自己的追求。
盡管這份追求幾乎注定一路獨(dú)行。
但她始終樂在其中,前行一路上最大的動力是興趣。
除了興趣之外最大的原因,則是因?yàn)楣ぷ鲙淼淖院栏小?p> 作為麻省理工學(xué)院自然語言處理研究項(xiàng)目文本摘要小組中的一名成員,她也有理由自豪。
畢竟世界上效率最高的抽取式文本摘要算法就是他們小組搞定的。
伊芙·卡莉一向以此為榮。
然而這份榮光在半小時前卻蕩然無存。
比他們團(tuán)隊(duì)開發(fā)的抽取式文本摘要算法還要強(qiáng)的新的文本摘要算法問世了。
而且還是以成熟應(yīng)用的形式直接出現(xiàn)在了蘋果的應(yīng)用商店中。
伊芙·卡莉也是接收到尼克的求助郵件才獲悉了這件事。
事實(shí)上剛收到來自尼克那措辭夸張的求助郵件她還有點(diǎn)懷疑。
她甚至一度以為是尼克那個自大而又愚蠢的幸運(yùn)白/癡記錯了愚人節(jié)的日期。
尼克用的那個軟件里的算法表面上是伊瑟劣的團(tuán)隊(duì)負(fù)責(zé)的
但實(shí)際上麻省理工學(xué)院的自然語言處理項(xiàng)目文本摘要小組才是該算法真正的出處,
尼克軟件里所采用算法可以說是伊芙·卡莉他們課題組每個人心血的結(jié)晶。
對于其親自參與搞定的算法伊芙·卡莉還是很自信的。
怎么可能有軟件的算法對新聞?wù)幚硇时人麄冮_發(fā)的算法處理效率更高呢?
并不是她本人夜郎自大盲目自信。
之前很多出現(xiàn)在應(yīng)用商店里很多打著新聞?wù)焯柕能浖暮诵乃惴▽?shí)際效率都十分低下。
甚至很多號稱算法獨(dú)步的新聞?wù)绦蜃罱K也只是被證明是徒有虛名而已。
對于這次所謂的南風(fēng)APP宣稱的什么地表效率最強(qiáng)準(zhǔn)確度全球最高
開始時伊芙·卡莉也只是把這些slogan當(dāng)作噱頭而已,并沒有放在眼里。
然而事實(shí)卻很打臉,這個南風(fēng)APP非但不是紙老虎,反而堪稱絕世兇獸。
至少在處理新聞?wù)@方面南風(fēng)APP所采用的算法在效率方面是強(qiáng)到離譜。
經(jīng)過量化測試,伊芙·卡莉更是發(fā)現(xiàn)南風(fēng)APP 100輪測試?yán)镉⑽男侣務(wù)钠骄俣纫饶峥碎_發(fā)的那個軟件軟件快241%。
這還不算什么,將南風(fēng)APP在計(jì)算力更高的虛擬機(jī)上運(yùn)行時。
100輪測試?yán)镉⑽男侣務(wù)钠骄俣雀潜韧瑮l件下他們的那種算法的摘要平均速度要快350%。
可以說是全方位吊打了。
伊芙·卡莉很不理解,怎么可能有一種算法在抽取式文本摘要算法在效率上比他們開發(fā)的算法效率強(qiáng)出三倍之多。
根據(jù)他們的研究,現(xiàn)在的抽取式文本摘要算法潛能幾乎已經(jīng)發(fā)掘殆盡了。
莫非是南風(fēng)APP的算法團(tuán)隊(duì)找到了壓榨抽取式文本摘要算法潛能的新方式了?
不可能,絕對不可能。
再怎么著他們的研究小組也是匯聚了全球首屈一指技術(shù)大牛的自然語言處理算法團(tuán)隊(duì)啊。
沒道理他們這些精英會被人在同一方向后來居上。
如果南風(fēng)APP算法團(tuán)隊(duì)不是后來居上的話,那應(yīng)該就是彎道超車了?
也就是說南風(fēng)APP的算法采用的絕對不是傳統(tǒng)的抽取式文本摘要算法,而應(yīng)該是采用了一種全新的摘要算法。
外行看熱鬧,內(nèi)行看門道。
伊芙卡莉從之前南風(fēng)APP進(jìn)行的幾組新聞?wù)獪y試的輸入輸出結(jié)果中很快驗(yàn)證了她的猜測。
南風(fēng)APP果然采用了全新的文本摘要算法。
至于判斷的依據(jù)么,很簡單。
抽取式的文本摘要直接從原文中摘取單詞或完整的短語作為文章的摘要。
這個過程并不會產(chǎn)生新聞原文中沒有的單詞和短語。
而南風(fēng)APP這款軟件在新聞?wù)袇s會產(chǎn)生很多新聞原文中沒有的單詞和短語。
也就是說南風(fēng)APP中所采用的算法絕對不是抽取式算法,至少不單單是抽取式算法。
而這種新的算法在進(jìn)行新聞?wù)囊淮筇卣魇菚a(chǎn)生新聞原文中沒有的單詞和短語。
比起傳統(tǒng)的抽取式文本摘要,伊芙·卡莉覺得南風(fēng)APP里這種全新的摘要方式更像是生成式的摘要方式。