Excel資料分析之描述統計及其涵義

來源:酷知科普網 1.79W

描述一列資料的特徵(比如近10年來GDP資料),可以計算出最大值、最小值、平均數、總數、眾數、中位數、方差等資料來進行描述。本文介紹如何利用Excel的資料分析功能一次性計算出這些特徵值,並說明這些特徵值的涵義,以方便應用。

操作方法

(01)點選如圖所示紅色尖頭1所指向的“資料”,如果出現紅色尖頭2所指向的“資料分析”選項,則直接點選該項進入資料分析。如果未找到“資料分析”選項,則請點選下面的連結“Excel選單欄上資料分析功能的調出”所介紹的方法將“資料分析”選項調出。

Excel資料分析之描述統計及其涵義

(02)點選“資料分析”選項後彈出如圖所示的視窗。如紅色尖頭1所示點選“描述統計”,再如紅色尖頭2所示點選“確定”按鈕。

Excel資料分析之描述統計及其涵義 第2張

(03)彈出如圖所示的視窗,點選紅色長尖頭所指向的紅圈內的方塊。

Excel資料分析之描述統計及其涵義 第3張

(04)出現如圖所示的介面,使用滑鼠左鍵選定所需要統計的資料項。本例如圖紅色紅尖頭1所指向的紅框內的資料(使用滑鼠左鍵選定),即B1:B21。然後點選紅色尖頭2所指向的方塊。

Excel資料分析之描述統計及其涵義 第4張

(05)出現如圖所示的視窗。按照圖示將文字前面的勾打上。在“輸出選項”欄選定“輸出區域”,點選右邊空白方框邊上的小紅尖頭。

Excel資料分析之描述統計及其涵義 第5張

(06)出現如圖所示的介面,在Excel的任意空白處點選一下(如圖所示紅色尖頭1所指向,本例點選了D1)。然後點選如圖紅色尖頭2所指向的方塊,返回到上一步所示的圖示(步驟5)點選該圖長紅色尖頭所指向的“確定”按鈕。

Excel資料分析之描述統計及其涵義 第6張

(07)最後得到如圖所示的統計結果(即所謂描述統計的結果)。

Excel資料分析之描述統計及其涵義 第7張

(08)上述資料的涵義如下:平均值反映了資料的平均水平。標準誤差是指樣本平均值的“抽樣誤差”。中位數是對資料趨中性的一種描述,是樣本中資料從小到大排列後的中間值。若樣本容量為奇數,則取中間的資料值,若為偶數,則取中間兩個資料的平均值。眾數是樣本資料中出現頻率最高的數值。標準偏差是所選樣本的標準差,是衡量數值相對於其平均值的離散程度的指標。方差是標準偏差的平方,同樣是描述資料離散程度的指標。峰度是刻畫測度資料分佈陡緩程度的指標,若峰度>0,則說明其分佈較標準常態分佈曲線更尖銳,也就是資料更向平均值聚集,屬於尖峰分佈;若峰度<0,則說明其較標準常態分佈曲線更寬闊一些,離散程度較大,屬於平峰分佈;若峰度=0,則資料的分佈性狀即為標準常態分佈曲線。偏度也就是偏態係數,也稱不對稱度,是測度資料分佈的偏斜方向和程度的指標。若偏度>0,則說明其分佈較常態分佈曲線更向右偏,稱為正偏或右偏,說明存在偏大的極端值,有一條長尾拖在分佈曲線的右端;若偏度<0,則分佈為負偏或左偏,存在較小的極端值;若偏度=0,則資料的分佈曲線左右對稱。偏度的絕對值越大,說明資料分佈曲線的偏斜程度就越大,偏度=0是就是無偏斜的情況。最大值為整個資料系列中數值最大的一個,最小值為資料系列中數值最小的一個,它們刻畫了資料的離散狀況。最大值與最小值之差稱為極差,它反映了樣本資料整體涵蓋的範圍大小。置信水平表示樣本資料的數值落在某一區間的概率,置信度則為在一定置信水平的情況下,樣本平均值可能出現的最大偏差,此時,總體平均值的置信區間即為樣本平均值±置信度,求解置信區間實際上是置信度的求解過程。

熱門標籤