第二百五十二章 柯西估計(jì)(概率和統(tǒng)計(jì))
1807年至1810年柯西在工學(xué)院學(xué)習(xí),曾當(dāng)過(guò)交通道路工程師。由于身體欠佳,接受了拉格朗日和拉普拉斯的勸告,放棄工程師而致力于純數(shù)學(xué)的研究??挛髟跀?shù)學(xué)上的最大貢獻(xiàn)是在微積分中引進(jìn)了極限概念,并以極限為基礎(chǔ)建立了邏輯清晰的分析體系。這是微積分發(fā)展史上的精華,也是柯西對(duì)人類科學(xué)發(fā)展所做的巨大貢獻(xiàn)。
有時(shí)看著這些密密麻麻的橋梁力學(xué)上的各種數(shù)據(jù),柯西陷入沉思,在想這些數(shù)據(jù)意味著什么。
意味著不同的橋梁之間,這些數(shù)據(jù)是不同的。
但是差不多相同的橋梁,數(shù)據(jù)之間或許會(huì)有某種聯(lián)系。
但數(shù)據(jù)過(guò)多,能不能處理成少些的有代表性的數(shù)據(jù)來(lái)體現(xiàn)這兩個(gè)橋的聯(lián)系?
或者找到關(guān)鍵數(shù)據(jù)來(lái)看看兩個(gè)橋梁之間的不同。
這就需要一種把大量數(shù)據(jù)化簡(jiǎn)的能力,來(lái)識(shí)別不同橋梁,來(lái)識(shí)別橋梁出現(xiàn)的各種特征。
需要高維度性質(zhì)的數(shù)據(jù),向低維度數(shù)據(jù)轉(zhuǎn)化。
在高維數(shù)據(jù)向低維數(shù)據(jù)轉(zhuǎn)化時(shí),使用最小二乘法的誤差會(huì)有些大。
圖形處理識(shí)別中,會(huì)用到降維算法。
柯西估計(jì)可以計(jì)算監(jiān)督降維算法。
在樣本生產(chǎn)過(guò)程中,由于訓(xùn)練是認(rèn)為處理,一個(gè)不當(dāng)操作的誤差會(huì)導(dǎo)致生成大量不準(zhǔn)確樣本,而這些錯(cuò)誤不可避免,所以識(shí)別率也會(huì)下降。
解決的方法是設(shè)計(jì)損失函數(shù)時(shí),用柯西損失代替最小二乘法損失。
使用knn方法來(lái)找不同樣本的特征時(shí),由于距離小,不方便提取重要的區(qū)別信息。
所以要把距離改大些,才能更好的提取特征進(jìn)行識(shí)別。
柯西估計(jì)寫(xiě)出了估計(jì)公式ζ(x)=log(1+(x/c)^2)。