統(tǒng)計(jì)學(xué)領(lǐng)域的數(shù)據(jù)計(jì)算量相當(dāng)龐大。因此使用計(jì)算機(jī)解決統(tǒng)計(jì)分析問(wèn)題成了人們必然的選擇,可以使用編程語(yǔ)言,利用編程語(yǔ)言中基本的函數(shù)設(shè)計(jì)計(jì)算公式,錄入數(shù)據(jù)完成統(tǒng)計(jì)分析,或者使用統(tǒng)計(jì)分析軟件,錄入數(shù)據(jù)完成統(tǒng)計(jì)分析。目前較為流行的編程語(yǔ)言為Python,較為流行的數(shù)據(jù)分析軟件為SPSS,那么SPSS和Python的區(qū)別是什么?


以下是使用SPSS進(jìn)行的描述統(tǒng)計(jì)分析的步驟:


1.錄入數(shù)據(jù)文件


以一個(gè)班級(jí)學(xué)生的語(yǔ)文成績(jī)?yōu)槔枰?/span>SPSS數(shù)據(jù)表中設(shè)置兩個(gè)變量,姓名和語(yǔ)文成績(jī),設(shè)置方法如圖1所示。


1設(shè)置變量屬性


設(shè)置完畢后打開數(shù)據(jù)視圖向其中輸入數(shù)據(jù),如圖2所示。


2錄入學(xué)生成績(jī)


2.分析數(shù)據(jù)文件


數(shù)據(jù)錄入完畢后,如圖3所示,依次點(diǎn)擊分析,描述統(tǒng)計(jì),描述,將語(yǔ)文成績(jī)?cè)O(shè)置為變量,然后點(diǎn)擊選項(xiàng),選中平均值,最大值,最小值,方差,標(biāo)準(zhǔn)差,峰度和偏度,然后點(diǎn)擊繼續(xù),確定。


3描述性統(tǒng)計(jì)分析


語(yǔ)文成績(jī)描述性統(tǒng)計(jì)分析結(jié)果如圖4所示。

 

4分析結(jié)果


如果使用Python進(jìn)行描述性統(tǒng)計(jì),至少需要運(yùn)行以下的代碼:

#計(jì)算均值

mean(data)

#計(jì)算中位數(shù)

median(data)

#計(jì)算眾數(shù)

mode(data)

#極差

ptp(data)

#方差

var(data)

#標(biāo)準(zhǔn)差

std(data)

#變異系數(shù)

mean(data) / std(data)

...


可以看出,Python語(yǔ)言非常抽象,對(duì)于初學(xué)者并不友好,特別是沒(méi)有計(jì)算機(jī)基礎(chǔ)的用戶。很多統(tǒng)計(jì)分析用戶并非計(jì)算機(jī)行業(yè)從業(yè)者,能抽出學(xué)習(xí)語(yǔ)言的時(shí)間更少,使用Python就更為困難。