計算相關(guān)系數(shù)

查看散點圖時需要問很多問題。最常見的一種是想知道直線接近數(shù)據(jù)的程度。為了幫助回答這個問題,有一個稱為相關(guān)系數(shù)的描述性統(tǒng)計量。我們將看到如何計算此統(tǒng)計信息。

The Correlation Coefficient

r表示的相關(guān)系數(shù)告訴我們散點圖中的數(shù)據(jù)沿直線下降的緊密程度。r的**值越接近1,線性方程描述的數(shù)據(jù)越好。如果r=1或r=-1,則數(shù)據(jù)集完全對齊。值r接近零的數(shù)據(jù)集幾乎沒有直線關(guān)系。

由于計算時間長,**使用計算器或統(tǒng)計軟件計算r。但是,知道計算器在計算時正在做什么總是值得的。下面是一個主要用手工計算相關(guān)系數(shù)的過程,計算器用于常規(guī)算術(shù)步驟。

計算r

的步驟

我們將首先列出計算相關(guān)系數(shù)的步驟。我們使用的數(shù)據(jù)是配對數(shù)據(jù),每對數(shù)據(jù)將用(x,y)表示健康知識我知道手抄報。

  1. 我們從一些初步計算開始。這些計算的數(shù)量將用于我們計算r:
    1. 計算x?,數(shù)據(jù)的所有第一坐標的平均值x。
    2. 計算?,數(shù)據(jù)的所有第二坐標的平均值
    3. y。
    4. 計算s所有樣本的標準差數(shù)據(jù)的第一個坐標中的一個x。
    5. 計算s數(shù)據(jù)的所有第二個坐標的樣本標準偏差y。
  2. Use公式(z)=(x–x?)/s并計算每個x的標準化值。
  3. 使用公式(z)=(y–?)/s并計算每個y標準化值。
  4. 乘以相應(yīng)的標準值:(z)(z)
  5. 添加**一步的產(chǎn)品
  6. 將上一步的總和除以n–1,其中n是我們配對數(shù)據(jù)集中的點總數(shù)。所有這些的結(jié)果是相關(guān)系數(shù)r。

這個過程并不難,每一步都是相當常規(guī)的,但所有這些步驟的收集都非常復(fù)雜。標準偏差的計算本身就足夠繁瑣。但是相關(guān)系數(shù)的計算不僅涉及兩個標準偏差,還涉及許多其他操作。

示例

為了確切地看到如何獲得r的值,我們看一個例子。同樣,重要的是要注意,對于實際應(yīng)用,我們希望使用計算器或統(tǒng)計軟件為我們計算r。

我們首先列出配對數(shù)據(jù):(1,1),(2,3),(4,5),(5,7)。x值的平均值,1,2,4和5的平均值是x?=3。我們也有?=4。標準差

x值為s=1.83和s=2.58。下表總結(jié)了r所需的其他計算。最右邊欄中的產(chǎn)品總和為2.969848。由于總共有四個點,4-1=3,我們將產(chǎn)品總和除以3。這給我們一個相關(guān)系數(shù)r=2.969848/3=0.989949。

表相關(guān)系數(shù)計算示例

186 1 187188 1 189198 2 199
xyzzzz
-1.09544503-1.1618949581.272792057
3-0.547722515-0.3872983190.212132009
450.5477225150.3872983190.212132009
571.095445031.1618949581.272792057

教育資源網(wǎng)_1