1、在描述統(tǒng)計中,可以通過統(tǒng)計量描述數(shù)據(jù)的分布特征。
對數(shù)據(jù)分布特征的測度:①分布的集中趨勢(反應(yīng)向中心值的聚集程度);②分布的離散程度(反應(yīng)各數(shù)據(jù)的差異程度,和中心數(shù)據(jù)的代表程度);③分布的偏態(tài)(反應(yīng)數(shù)據(jù)分布的不對稱性)。
2、集中趨勢的測度
集中趨勢,是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢也就是尋找數(shù)據(jù)一般水平的代表值或中心值。
集中趨勢的測度 | 概念 | 優(yōu)點 | 缺點 | 適用范圍 |
均值(數(shù)值平均數(shù)) | 平均數(shù),集中趨勢最主要的測度值,數(shù)據(jù)的重心,解釋了數(shù)據(jù)的平均水平。 | 能充分利用數(shù)據(jù)全部信息,受到每個觀測值的影響,較穩(wěn)定 | 易受極端值的影響。 | 適用于定量變量,數(shù)值型數(shù)據(jù),不適用與分類和順序數(shù)據(jù)。 |
中位數(shù)(位置平均數(shù)) | 把一組數(shù)據(jù)按從小到大的順序進(jìn)行排列,位置居中的數(shù)值叫做中位數(shù)。 | 不受極值個影響,抗干擾性強。 | 沒有充分利用數(shù)據(jù)的全部信息,穩(wěn)定性差于均值,優(yōu)于眾數(shù)。 | 適用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),不適用于分類數(shù)據(jù)。尤其適用分布不對稱的數(shù)值型數(shù)據(jù)。 |
眾數(shù)(位置平均數(shù)) | 一組數(shù)據(jù)中出現(xiàn)次數(shù)或頻數(shù)最多的變量值。 | 不受極值影響。 | 沒有充分利用數(shù)據(jù)的全部信息,缺乏穩(wěn)定性,而且可能不唯一。 | 適用于分類和順序變量,不適用于定量變量。 |
3、離散程度的測度
離散程度,是指數(shù)據(jù)之間的差異程度或頻數(shù)分布的分散程度。離散程度的測度,主要包括極差、方差和標(biāo)準(zhǔn)差、離散系數(shù)等。適用于數(shù)值型數(shù)據(jù)。
①極差,極差是最簡單的變異指標(biāo),是總體或分布中最大的標(biāo)志值與最小的標(biāo)志值之差,又稱全距,用R表示。
②方差:數(shù)據(jù)組中各數(shù)值與其均值離差平方的平均數(shù),是實際中用的最廣泛的離散程度測度值,越小則均值代表性越好。
③標(biāo)準(zhǔn)差,總體所有單位標(biāo)志值與其平均數(shù)離差之平方的平均數(shù)的平方根。
④離散系數(shù)
極差、標(biāo)準(zhǔn)差和方差等都是反映數(shù)據(jù)分散程度的絕對值。為消除變量值水平高低和計量單位不同對離散程度測定值的影響,需要計算離散系數(shù)。
4、分布形態(tài)的測度
①偏態(tài)系數(shù)
②標(biāo)準(zhǔn)分?jǐn)?shù)
5、變量間的相關(guān)分析
①變量間相關(guān)關(guān)系的分類:
按相關(guān)程度分:完全相關(guān),不完全相關(guān),不相關(guān)。
按相關(guān)方向分:正相關(guān),負(fù)相關(guān)。
按相關(guān)形式分:線性相關(guān)(不一定是直線,曲線也可以),非線性相關(guān)。
相關(guān)關(guān)系并不等同于因果關(guān)系,即有相關(guān)關(guān)系的變量之間,并不一定一方由另一方引起。
②散點圖:可以表示兩個變量之間的關(guān)系。
6、相關(guān)系數(shù)
相關(guān)系數(shù)是度量兩個變量間相關(guān)關(guān)系的統(tǒng)計量。最常用的相關(guān)系數(shù)是Pearson相關(guān)系數(shù),度量的兩個變量間的線性相關(guān)關(guān)系。