統計學領域的數據計算量相當龐大。因此使用計算機解決統計分析問題成了人們必然的選擇,可以使用編程語言,利用編程語言中基本的函數設計計算公式,錄入數據完成統計分析,或者使用統計分析軟件,錄入數據完成統計分析。目前較為流行的編程語言為Python,較為流行的數據分析軟件為SPSS,那么SPSS和Python的區別是什么?
以下是使用SPSS進行的描述統計分析的步驟:
1.錄入數據文件
以一個班級學生的語文成績為例,需要在SPSS數據表中設置兩個變量,姓名和語文成績,設置方法如圖1所示。
圖1設置變量屬性
設置完畢后打開數據視圖向其中輸入數據,如圖2所示。
圖2錄入學生成績
2.分析數據文件
數據錄入完畢后,如圖3所示,依次點擊分析,描述統計,描述,將語文成績設置為變量,然后點擊選項,選中平均值,最大值,最小值,方差,標準差,峰度和偏度,然后點擊繼續,確定。
圖3描述性統計分析
語文成績描述性統計分析結果如圖4所示。
圖4分析結果
如果使用Python進行描述性統計,至少需要運行以下的代碼:
#計算均值
mean(data)
#計算中位數
median(data)
#計算眾數
mode(data)
#極差
ptp(data)
#方差
var(data)
#標準差
std(data)
#變異系數
mean(data) / std(data)
...
可以看出,Python語言非常抽象,對于初學者并不友好,特別是沒有計算機基礎的用戶。很多統計分析用戶并非計算機行業從業者,能抽出學習語言的時間更少,使用Python就更為困難。