spass線性回歸

  回歸分析是一種應用很廣的數量分析方法,用於分析事物間的統計關係,側重數量關係變化。回歸分析在數據分析中占有比較重要的位置。

一元線性回歸模型:指只有一個解釋變量的線性回歸模型,用來揭示被解釋變量與另一個解釋變量的線性關係。

多元線性回歸模型:指含有多個揭示變量的線性回歸模型,用來揭示被解釋變量與多個解釋變量的線性關係。

此篇文章主要講述多元線性回歸分析。

方法/步驟

線性回歸分析的內容比較多,比如回歸方程的擬合優度檢驗、回歸方程的顯著性檢驗、回歸系數的顯著性檢驗、殘差分析、變量的篩選問題、變量的多重共線性問題。

操作見圖。回歸分析通常需要多次試驗操作才可以得出較好的模型。「方法」中選擇「進入」,表示所有的自變量都進入模型,目前還沒有考慮到變量的多重共線問題,要先觀察初步的結果分析,才會考慮發哦變量的多重共線問題。

spass線性回歸

spass線性回歸

通過觀察調整後的判定系數0.924,擬合優度較高,不被解釋的變量較少。

由回歸方程顯著性檢驗的概率為0,小於顯著性水平0.05,則認為系數不同時為0,被解釋變量與解釋變量全體的線性關係是顯著的,可建立線性方程。

由系數表知,觀察回歸系數顯著性檢驗中的概率值,如果顯著性水平為0.05,除去「投入人年數」外,其他變量均大於顯著性水平,這些變量保留在方程中是不正確的。所以該模型不可用,應重新建模。

spass線性回歸

重新建模操作見圖片,採用的是「向後篩選」方法,依次剔除的變量是專著數、投入高級職稱的人年數、投入科研事業費、獲獎數、論文數。最後的模型結果是「立項課題數=-94.524+0.492x投入人年數」。

spass線性回歸

spass線性回歸

spass線性回歸

殘差分析:

又P-P圖可知,原始數據與正態分布的不存在顯著的差異,殘差滿足線性模型的前提要求。

由庫克距離(0.041小於1)和杠桿指變量的值知,沒有顯著的差異。

殘差點在0線周圍隨機分布。

spass線性回歸

spass線性回歸

spass線性回歸