2011年中級(jí)經(jīng)濟(jì)師考試工商管理預(yù)習(xí)講義(15)
3.相關(guān)分析
所謂相關(guān)分析,是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。
變量之間的相關(guān)關(guān)系主要有線性相關(guān)和非線性相關(guān)、正相關(guān)和負(fù)相關(guān)等幾種形式。
對(duì)兩個(gè)變量間線性相關(guān)程度的測(cè)量稱為簡(jiǎn)單相關(guān)系數(shù)。樣本相關(guān)系數(shù)定義公式為:
式中,r為樣本相關(guān)系數(shù),COVXY為協(xié)方差,Sx、Sy分別是變量x和y的標(biāo)準(zhǔn)差。(注意:公式中分子分母求和表達(dá)式中應(yīng)該是i=1到n,而不是n=1到n)
相關(guān)系數(shù)r的取值范圍在-1~+1之間。
·r=1或r=-1時(shí),表明變量間的關(guān)系為完全正相關(guān)或完全負(fù)相關(guān),這是兩種極端的情況,實(shí)際上表明兩個(gè)變量之間是線性關(guān)系;
·r=0時(shí),表明變量間不存在線性相關(guān)關(guān)系,可能是無(wú)相關(guān),也可能是非線性相關(guān);
·0<1時(shí),表明變量間存在正相關(guān)關(guān)系;< p>
·-l<0時(shí),表明變量同存在負(fù)相關(guān)關(guān)系。< p>
|r|愈接近于l,變量間相關(guān)程度愈高,|r|愈接近于0,相關(guān)程度愈低。
在一般情況下,總體相關(guān)系數(shù)p是未知的,一般是用樣本相關(guān)系數(shù)r作為總體相關(guān)系數(shù)P的估計(jì)值。但由于存在樣本抽樣的隨機(jī)性,樣本相關(guān)系數(shù)并不直接反映總體相關(guān)程度,因而,計(jì)算出來(lái)的樣本相關(guān)系數(shù)在多大程度上值得信賴,需要進(jìn)行檢驗(yàn)。
|r|<自由度(df)為(n-2)的t統(tǒng)計(jì)量t(n-2)、顯著性為a(10%;5%)的相關(guān)系數(shù)(查相關(guān)系數(shù)表),其相關(guān)性是顯著的。所謂“顯著水平”或r=0,指的是很少會(huì)發(fā)生的概率。
(教材這句話是錯(cuò)誤的,正確的表達(dá)為:
在實(shí)際中,因?yàn)檠芯磕康?、變量類型的不同,采用的相關(guān)分析也不同。比較常用的相關(guān)分析有二元定距變量的相關(guān)分析、二元定序變量的相關(guān)分析、偏相關(guān)分析和距離分析等。
(二)推論統(tǒng)計(jì)分析
推論統(tǒng)計(jì)是在隨機(jī)抽樣的基礎(chǔ)上,根據(jù)部分資料(數(shù)據(jù))推斷總體的方法,也即利用樣本資料對(duì)抽出樣本的總體做出推論的方法。
1.單個(gè)樣本的參數(shù)估計(jì)
參數(shù)是指總體的某一特征值,如均值、方差等,往往是未知數(shù);而根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的均值、樣本標(biāo)準(zhǔn)差、樣本比例一般稱為樣本“統(tǒng)計(jì)量”。參數(shù)估計(jì)是根據(jù)樣本統(tǒng)計(jì)量對(duì)總體未知參數(shù)進(jìn)行某種估計(jì)推斷。
(1)點(diǎn)估計(jì)。當(dāng)總體分布的形式已知,但其中的一個(gè)或多個(gè)參數(shù)未知時(shí),如果從總體中抽取一個(gè)樣本,用該樣本對(duì)未知參數(shù)作一個(gè)數(shù)值點(diǎn)的估計(jì),稱為參數(shù)的點(diǎn)估計(jì)。
例如:假設(shè)對(duì)北京1800萬(wàn)人的工資水平進(jìn)行調(diào)查,一般情況下,需要進(jìn)行抽樣調(diào)查,假設(shè)抽取1000個(gè)樣本,得出的平均工資為2500元每月,這個(gè)2500就是樣本的平均值,用 來(lái)表示,方差為200,所謂的點(diǎn)估計(jì)就是直接用樣本的均值和方差來(lái)表示總體的均值和方差,即北京1800萬(wàn)人的平均工資就是2500元,方差為200。
點(diǎn)估計(jì)有多種方法,如矩法、似然法、小二乘法等。
(2)區(qū)間估計(jì)。區(qū)間估計(jì)是用一個(gè)區(qū)間估計(jì)總體未知參數(shù)。設(shè)x1…,xn是來(lái)自總體的一個(gè)樣本,對(duì)于給定的α(0<α<1),若有兩個(gè)統(tǒng)計(jì)量θ1 (x1,…,x2)和θ2 (x1,…,xn),使得:P(θ1<θ>θ2)=1—α,則稱1—α為信度(或置信度、置信概率),(θ1θ2)是θ的信度為1—α的置信區(qū)間,α稱為顯著性水平。
置信區(qū)間給出了區(qū)間估計(jì)的程度,區(qū)間越小度越高。置信概率給出了區(qū)間估計(jì)的可靠性。
例如1800萬(wàn)人的工資進(jìn)行區(qū)間估計(jì)時(shí),取α為10%,置信區(qū)間為(2300,2700),就表示北京1800萬(wàn)人的平均工資μ有90%的概率落在2300到2700元之間?;蛘哒f(shuō)進(jìn)行100次估計(jì)時(shí),有大約90次是位于2300到2700之間,有大約10次位于2300到2700之外。
?、倏傮w方差σ2已知時(shí),總體均值μ的區(qū)間估計(jì)(采用Z統(tǒng)計(jì)量)
置信度為l一α?xí)r,總體均值μ的置信區(qū)間為:
即: ,那么
是區(qū)間信度下的臨界點(diǎn),稱可靠性系數(shù)。信度越高,可靠性系數(shù)越大。
是區(qū)間估計(jì)時(shí)已知n和σ,對(duì)應(yīng)一定的信度的置信區(qū)間的半徑,也就是估計(jì)時(shí)的允許誤差。
?、诳傮w方差σ2未知時(shí),總體均值μ的區(qū)間估計(jì)(采用t統(tǒng)計(jì)量)
如果總體服從正態(tài)分布,但σ2未知,可以用樣本標(biāo)準(zhǔn)差S代替σ建立置信區(qū)間。此時(shí)統(tǒng)計(jì)量不是服從標(biāo)準(zhǔn)正態(tài)分布,而是服從自由度(df)為n-1的t分布。
此時(shí),總體均值μ在置信度為1-α下的置信區(qū)間為:
2.單個(gè)樣本的假設(shè)檢驗(yàn)
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的重要組成部分,它們都是利用樣本信息對(duì)總體狀況做出某種推斷(判斷),但是推斷的角度不同。
·參數(shù)估計(jì)是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),估計(jì)前總體參數(shù)是未知的。(例如,對(duì)北京市1800萬(wàn)人平均工資進(jìn)行調(diào)查,參數(shù)估計(jì)就是指在調(diào)查之前不知道平均工資是多少,然后采用抽樣調(diào)查,抽取1000個(gè)樣本進(jìn)行調(diào)查,這1000人的平均工資是2500,就認(rèn)為1800萬(wàn)人的平均工資是2500)
·假設(shè)檢驗(yàn)則是先對(duì)總體參數(shù)的值提出一個(gè)假設(shè),然后利用樣本信息,根據(jù)抽樣分布的原理去檢驗(yàn)原先提出的假設(shè)是否成立。(例如,對(duì)北京市1800萬(wàn)人平均工資進(jìn)行調(diào)查,假設(shè)檢驗(yàn)就是指在調(diào)查之前假設(shè)這1800萬(wàn)人的平均工資是3000,然后采用抽樣調(diào)查,抽取1000個(gè)樣本進(jìn)行調(diào)查,利用這1000人的平均工資數(shù)來(lái)判斷3000的假設(shè)對(duì)不對(duì))
進(jìn)行假設(shè)檢驗(yàn)時(shí),通常經(jīng)過(guò)以下步驟:
(1)提出原假設(shè)和替換(備擇)假設(shè)。預(yù)先所設(shè)的這一假設(shè)稱為原假設(shè),用H0表示。與原假設(shè)相對(duì)的假設(shè)是替換假設(shè),它是原假設(shè)經(jīng)檢驗(yàn)不成立被拒絕接受時(shí),所應(yīng)接受的與原假設(shè)相對(duì)立的情況,用H1表示。
(2)確定并計(jì)算檢驗(yàn)統(tǒng)計(jì)量。
總體方差σ2已知時(shí),應(yīng)用Z統(tǒng)計(jì)量(服從正態(tài)分布),計(jì)算公式為:
總體方差σ2未知時(shí),應(yīng)用t統(tǒng)計(jì)量(服從t分布),計(jì)算公式為:
式中: 為樣本均值,μ0為原假設(shè)的參數(shù)值,σ(S)為總體(樣本)標(biāo)準(zhǔn)差
(3)規(guī)定顯著性水平α,并確定接受域與拒絕域的臨界值。通??扇ˇ?0.05或α=0.01,查出 或者 的值,即接受域與拒絕域的臨界值。
(4)做出統(tǒng)計(jì)決策。
總體方差已知,用Z統(tǒng)計(jì)量檢驗(yàn):
如果|Z|< ,則檢驗(yàn)統(tǒng)計(jì)量的值位于接受域,接受原假設(shè),拒絕替換假設(shè);
如果|Z|> ,則檢驗(yàn)統(tǒng)計(jì)量的值位于拒絕域,拒絕原假設(shè),接受替換假設(shè)。
總體方差未知,用t統(tǒng)計(jì)量檢驗(yàn):
如果|t|< ,則檢驗(yàn)統(tǒng)計(jì)量的值位于接受域,接受原假設(shè),拒絕替換假設(shè);
如果|t|> ,則檢驗(yàn)統(tǒng)計(jì)量的值位于拒絕域,拒絕原假設(shè),接受替換假設(shè)。
?γ??????? | ??? | ???/???? | ??????? | ???? |
---|---|---|---|---|
2017???м???????????????? | ?????? | ??350 / ??350 | ???? | |
2017???м?????????? | ?????? | ??350 / ??350 | ???? | |
2017???м????????????????? | ?????? | ??350 / ??350 | ???? | |
2017???м????????????? | ????? | ??350 / ??350 | ???? | |
2017???м????????????? | ????? | ??350 / ??350 | ???? | |
2017???м???????????????? | ??? | ??350 / ??350 | ???? | |
2017???м?????????t????? | ??? | ??350 / ??350 | ???? | |
2017???м???????????t????? | κ???? | ??350 / ??350 | ???? |