線性回歸分析

線性回歸是一種統(tǒng)計技術,用于更多地了解獨立(預測)變量和依賴(標準)變量之間的關系。當您的分析中有多個自變量時,這稱為多元線性回歸。一般來說,回歸允許研究人員提出一個普遍的問題:“什么是**的預測…?”

例如,假設我們正在研究通過體重指數(shù)(BMI)測量的肥胖原因。特別是,我們想看看以下變量是否是一個人BMI的重要預測因素:每周吃快餐的次數(shù),每周看電視的小時數(shù),每周鍛煉的分鐘數(shù)以及父母的BMI。線性回歸將是此分析的良好方法。

回歸方程

當用一個自變量進行回歸分析時,回歸方程為Y=a+b*X其中Y是因變量,X是自變量,a是常數(shù)(或截距),b是回歸線的斜率。例如,假設GPA**通過回歸方程1+0.02*IQ預測。如果學生的智商為130,那么他或她的GPA將為3.6(1+0.02*130=3.6)。

當您進行回歸分析時,其中有多個自變量,回歸方程為Y=a+b1*X1+b2*X2+…+bp*Xp。例如,如果我們想在GPA分析中包含更多變量,例如動機和紀律的度量,我們將使用這個等式。

R-Square

R平方,也稱為確定系數(shù),是評估回歸方程模型擬合的常用統(tǒng)計量。也就是說,所有自變量在預測因變量方面有多好?R平方的值范圍從0.0到1.0,可以乘以100以獲得解釋的方差百分比。例如,回到我們只有一個自變量(IQ)的GPA回歸方程……讓我們說我們方程的R平方是0.4。我們可以將其解釋為意味著智商可以解釋GPA中40%的差異。如果我們再加上另外兩個變量(動機和紀律)并且R平方增加到0.6,這意味著智商,動機和紀律共同解釋了GPA分數(shù)的60%的變化。

回歸分析通常使用統(tǒng)計軟件(如SPSS或SAS)完成,因此為您計算R平方。

解釋回歸系數(shù)(b)

上面等式中的b系數(shù)表示自變量和因變量之間關系的強度和方向。如果我們看GPA和IQ方程,1+0.02*130=3.6,0.02是變量IQ的回歸系數(shù)。這告訴我們,這種關系的方向是積極的,所以隨著智商的增加,GPA也會增加。如果等式為1-0.02*130=Y,則這意味著IQ和GPA之間的關系為負。

假設

為了進行線性回歸分析,必須滿足幾個關于數(shù)據(jù)的假設:

  • 線性:假設自變量和因變量之間的關系是線性的。雖然這個假設永遠無法完全證實,但查看變量的散點圖可以幫助做出這個決定。如果存在關系中的曲率,則可以考慮轉(zhuǎn)換變量或顯式允許非線性分量。
  • 正態(tài)性:假設變量的殘差是正態(tài)分布的。也就是說,預測Y(因變量)值的誤差)以接近正態(tài)曲線的方式分布。您可以查看直方圖或正態(tài)概率圖來檢查變量的分布及其殘值。
  • 獨立性:假設Y值預測中的誤差都是彼此獨立的(不相關)。
  • 同方差:假設周圍的方差自變量的所有值的回歸線都是相同的。

Source

教育資源網(wǎng)_1

女性乳房健康知識