日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

统计学习:三大奇技(1)

發(fā)布時間:2025/3/15 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 统计学习:三大奇技(1) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

統(tǒng)計學(xué)習(xí)

最近在處理信號的過程中發(fā)現(xiàn)自己的理論水平還是太低,因此需要提高自己的技術(shù),因此開始惡補(bǔ)理論,寫下了這個系列的文章。

三大神技

雖然統(tǒng)計的理論成熟完備有效,但現(xiàn)實的情況總是和理論分析時的有所區(qū)別,因此,本文將要介紹三種現(xiàn)實中實用技術(shù)之一的bootstrapping。

拔靴法(bootstrapping)

拔靴法(Bootstrapping)是指對當(dāng)前手上有限的樣本資料經(jīng)過多次有放回的重復(fù)抽樣,擴(kuò)大樣本集,重新建立起足以代表總體分布的大樣本(這個命名來源是來自于一個俗語,一個人提著自己的鞋帶上了天堂,比如不可實現(xiàn))。
Bootstrapping 是通過具有統(tǒng)計具有相關(guān)特性的樣本數(shù)據(jù)來獲得該特性,它不斷地從真實數(shù)據(jù)中進(jìn)行抽樣,以擴(kuò)大之前得到的樣本。因為樣本數(shù)越大對于統(tǒng)計的效果就越好,同時對于估計結(jié)果的準(zhǔn)確性更為有利,所以提出了該方法。與分析方法相比,bootstrapping 的優(yōu)點在于,它無需對分布特性做嚴(yán)格的假定就能進(jìn)行推斷分析,這是因為它使用的數(shù)據(jù)就是真實數(shù)據(jù)。

統(tǒng)計學(xué)中,bootstrapping可以指依賴于重置隨機(jī)抽樣的一種擴(kuò)大樣本量的方法。bootstrapping可以用于計算樣本估計的準(zhǔn)確性。對于一個采樣,我們只能計算出某個統(tǒng)計量(例如均值)的一個取值,無法知道均值統(tǒng)計量的分布情況。但是通過自助法(自舉法)我們可以通過模擬計算出均值統(tǒng)計量的近似分布。有了假定的真實分布,很多依賴于此的統(tǒng)計處理就可以做了(比如說有你推出的結(jié)果來進(jìn)而推斷實際總體的分布)。

實現(xiàn)原理

bootstrapping方法的實現(xiàn)很簡單,假設(shè)已經(jīng)獲得的的樣本大小為NN:

在原樣本進(jìn)行有放回的抽樣,抽取MM次。每抽取一次算作一個一個新的采樣樣本,重復(fù)該操作,直到形成很多的新樣本集合,通過這些樣本集合就可以計算出樣本各個統(tǒng)計量的一個近似分布。
通常會把新樣本的數(shù)量擴(kuò)增到1000-10000。如果計算成本很小,或者對精度要求比較高,可以再增加新樣本的數(shù)量。
優(yōu)點:簡單易行,操作方便。
缺點:bootstrapping的運(yùn)用基于原始樣本有很多假設(shè),因此假設(shè)的成立與否會影響該方法使用的準(zhǔn)確性。

對于分布yθy(θ) ,要估計的參數(shù)為θθ。通過使用分析技術(shù)bootstrapping 估計的樣本,可以得到θ^θ^ 的近似統(tǒng)計量。

具體方法

具體方法是:從yy 中重復(fù)抽取NN 個大小為TT 的樣本,并用每個新樣本重復(fù)計算θ^θ^ ,即可得到一系列的θ^θ^ 估計值,同時可分析它們的分布情況。Bootstrapping 并不對θ^θ^抽樣分布的形狀提出要求,而是通過分析各次抽取后樣本內(nèi)統(tǒng)計量的變化,對抽樣分布進(jìn)行極大似然估計。從樣本內(nèi)不斷生成新的抽樣數(shù)據(jù),并替代原先的抽樣樣本,用以計算所研究的統(tǒng)計量。

總結(jié)

以上是生活随笔為你收集整理的统计学习:三大奇技(1)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。