什么是統(tǒng)計引導(dǎo)?

Bootstrapping是一種統(tǒng)計技術(shù),屬于更廣泛的重采樣標(biāo)題。該技術(shù)涉及一個相對簡單的過程,但重復(fù)了很多次,嚴(yán)重依賴于計算機(jī)計算。Bootstrapping提供了一種除置信區(qū)間之外的方法來估計總體參數(shù)。Bootstrapping似乎很像魔術(shù)。繼續(xù)閱讀以了解它如何獲得有趣的名稱。

引導(dǎo)的解釋

推理統(tǒng)計的一個目標(biāo)是確定人口參數(shù)的值。直接測量這一點通常太昂貴甚至不可能。所以我們使用統(tǒng)計抽樣。我們對人口進(jìn)行抽樣,測量此樣本的統(tǒng)計數(shù)據(jù),然后使用此統(tǒng)計數(shù)據(jù)來說明人口的相應(yīng)參數(shù)。

例如,在巧克力工廠,我們可能想保證糖果棒具有特定的平均重量。稱量生產(chǎn)的每一個糖果棒都是不可行的,所以我們使用抽樣技術(shù)隨機(jī)選擇100個糖果棒。我們計算這100個糖果酒吧的平均值,并說人口平均值落在我們樣本平均值的誤差范圍內(nèi)。

假設(shè)幾個月后我們想更準(zhǔn)確地知道-或者更少的誤差范圍-我們在采樣生產(chǎn)線當(dāng)天的平均糖果重量是多少。我們不能使用今天的糖果酒吧,因為進(jìn)入圖片的變量太多(不同批次的牛奶,糖和可可豆,不同的太空的小知識大氣條件,不同的員工在線等)。從我們好奇的那一天起,我們所擁有的就是100個重量。如果沒有時間機(jī)器回到那一天,看起來最初的誤差幅度是我們所能希望的**的。

幸運(yùn)的是,我們可以使用自舉技術(shù)。在這種情況下,我們用repl隨機(jī)抽樣從100個已知重量開始。然后我們稱之為引導(dǎo)程序樣本。由于我們允許更換,因此此引導(dǎo)程序樣本很可能與我們的初始樣本不同。某些數(shù)據(jù)點可能會重復(fù),而自舉樣本中可能會省略最初100個數(shù)據(jù)點中的其他數(shù)據(jù)點。在計算機(jī)的幫助下,可以在相對較短的時間內(nèi)構(gòu)建數(shù)千個引導(dǎo)程序樣本。

示例

如上所述,要真正使用引導(dǎo)技術(shù),我們需要使用計算機(jī)。以下數(shù)值示例將有助于演示該過程的工作原理。如果我們從樣本2,4,5,6,6開始,那么以下所有都是可能的引導(dǎo)樣本:

    34,2,5,5,6,6,35,36,4,5,6,6,37,38,2,2,4,5,5,39,40,2,2,2,4,6,41,42,2,2,2,2,2,43,44,4,6,6,6,45

技術(shù)史

Bootstrap技術(shù)在統(tǒng)計領(lǐng)域相對較新。第一次使用是由Bradley Efron在1979年的一篇論文中發(fā)表的。隨著計算能力的提高和成本的降低,自舉技術(shù)變得越來越普遍。

為什么名稱引導(dǎo)?

“bootstrapping”這個名字來自“用他的bootstraps抬起自己”這個詞。這是指一種傲慢而不可能的事情。盡可能努力地嘗試,你不能通過拖拉靴子上的皮革片來抬起自己。

有一些數(shù)學(xué)理論證明自舉技術(shù)是合理的。但是,使用自舉確實感覺你正在做不可能的事情。盡管似乎無法通過一次又一次地重復(fù)使用相同的樣本來改進(jìn)總體統(tǒng)計的估計,但實際上,引導(dǎo)可以做到這一點。

教育_1