統(tǒng)計(jì)和數(shù)學(xué)的自由度

在統(tǒng)計(jì)中,自由度用于定義可以分配給統(tǒng)計(jì)分布的獨(dú)立數(shù)量的數(shù)量。這個數(shù)字通常是指一個正數(shù),表示對一個人沒有限制'從統(tǒng)計(jì)問題中計(jì)算缺失因子的能力。

自由度在統(tǒng)計(jì)量的最終計(jì)算中充當(dāng)變量,用于確定系統(tǒng)中不同場景的結(jié)果,數(shù)學(xué)自由度定義確定完整向量所需的域中的維度數(shù)量。

為了說明自由度的概念,我們將查看有關(guān)樣本均值的基本計(jì)算,并找到數(shù)據(jù)列表的均值,我們添加所有數(shù)據(jù)并除以值的總數(shù)。

樣本均值

的插圖

暫時假設(shè)我們知道數(shù)據(jù)集的平均值是25,并且該集中的值是20,10,50和一個未知數(shù)字。樣本均值的公式給出了方程(20+10+50+x)/4=25,其中x表示未知,使用一些基本代數(shù),可以然后確定缺失的數(shù)字x等于20。

讓's稍微改變這種情況。我們再次假設(shè)我們知道數(shù)據(jù)集的平均值是25。但防溺水小知識是,這次數(shù)據(jù)集中的值是20,10和兩個未知值。這些未知數(shù)可能不同,所以我們使用兩個不同的變量xy,來表示這一點(diǎn)。所得方程為(20+10+x+y)/4=25。通過一些代數(shù),我們得到y=70-x。該公式以這種形式編寫,以顯示一旦我們選擇x的值,y的值就完全確定。我們有一個選擇,這表明有一個自由度。

現(xiàn)在我們來看看一百分之一的樣本量d、 如果我們知道這個樣本數(shù)據(jù)的平均值是20,但不知道任何數(shù)據(jù)的值,那么就有99個自由度。所有值必須總計(jì)20 x 100=2000。一旦我們在數(shù)據(jù)集中有99個元素的值,那么**一個已經(jīng)確定。

學(xué)生t分?jǐn)?shù)和卡方分布

使用Studentt得分表時,自由度起著重要作用。實(shí)際上有幾個t分?jǐn)?shù)分布。我們通過使用自由度來區(qū)分這些分布。

在這里,我們使用的概率分布取決于樣本的大小。如果我們的樣本量為n,則自由度數(shù)為n-1。例如,樣本量為22將要求我們使用具有21個自由度的t得分表的行。

卡方分布的使用還需要使用自由度。在此,以與t分?jǐn)?shù)分布相同的方式,樣本大小決定了使用哪個分布。如果樣本量n,則存在n-1自由度。

標(biāo)準(zhǔn)偏差和先進(jìn)技術(shù)

自由度出現(xiàn)的另一個地方是標(biāo)準(zhǔn)偏差的公式。這種情況并不那么明顯,但是如果我們知道在哪里看,我們可以看到它。為了找到標(biāo)準(zhǔn)偏差,我們正在尋找"平均值"與平均值的偏差。但是,在從每個數(shù)據(jù)值中減去平均值并將差異平方后,我們最終除以n-1,而不是像我們預(yù)期的那樣n。

n-1的存在來自自由度數(shù)。由于公式中使用了n數(shù)據(jù)值和樣本均值,因此存在n-1自由度。

更先進(jìn)的統(tǒng)計(jì)技術(shù)es使用更復(fù)雜的計(jì)算自由度的方法。當(dāng)計(jì)算具有nn元素的獨(dú)立樣本的兩個均值的檢驗(yàn)統(tǒng)計(jì)量時,自由度數(shù)具有相當(dāng)復(fù)雜的公式。它可以用108 n-1109和110 n-1111的較小值來估計(jì)

另一個計(jì)算自由度的不同方法的例子是F測試。在進(jìn)行118 F 119測試時,我們有120 k 121個樣本,每個樣本的大小為122 n 123--分子的自由度為124 k 125-1,分母為126 k 127(128 n 129-1)。