1、基本概念
①總體與樣本
②總體參數(shù)與樣本統(tǒng)計(jì)量
總體參數(shù)是抽樣調(diào)查中想要了解的,是未知常數(shù);
樣本統(tǒng)計(jì)量又稱(chēng)估計(jì)量,是一個(gè)隨機(jī)變量,與樣本選取及設(shè)計(jì)有關(guān),是對(duì)總體參數(shù)的估計(jì)。
③抽樣框
是供抽樣所用的所有抽樣單元的名單,是抽樣總體的具體表現(xiàn)。常用有名錄框,如企業(yè)名錄、電話(huà)簿、人員名冊(cè)。抽樣中的單位必須有序,高質(zhì)量的抽樣框應(yīng)當(dāng)提供被調(diào)查單位更多的信息,并且沒(méi)有重復(fù)和遺漏。
2、概率抽樣和非概率抽樣
①概率抽樣:又稱(chēng)隨機(jī)抽樣,依據(jù)隨機(jī)原則,按照事先設(shè)計(jì)的程序,從總體中抽取部分單元;
特點(diǎn):按一定的概率以隨機(jī)原則抽取樣本;抽中概率可計(jì)算;考慮每個(gè)樣本單元被抽中的概率。
②非概率抽樣:調(diào)查者根據(jù)自己的方便或主管判斷抽取樣本的方法,不依隨機(jī)原則。如判斷抽樣(主觀(guān)判斷),方便抽樣(如攔截式),自愿樣本(如網(wǎng)上調(diào)查),配額抽樣。
3、抽樣調(diào)查的一般步驟
確定調(diào)查問(wèn)題→調(diào)查方案設(shè)計(jì)→實(shí)施調(diào)查過(guò)程→數(shù)據(jù)處理分析→撰寫(xiě)調(diào)查報(bào)告。
4、抽樣調(diào)查中的誤差
①抽樣誤差:由于抽樣的隨機(jī)性造成的,樣本不同,對(duì)總體的估計(jì)也會(huì)不同;
②非抽樣誤差:抽樣框誤差,無(wú)回答誤差,計(jì)量誤差。
抽樣框誤差:抽樣框不完整造成數(shù)據(jù)的遺漏,抽樣框更新不及時(shí)產(chǎn)生無(wú)效數(shù)據(jù)等等;
無(wú)回答誤差:隨機(jī)因素如恰好不在,造成方差增大;非隨機(jī)因素如不愿意回答,造成方差增大、估計(jì)偏差。
計(jì)量誤差:數(shù)據(jù)與真值不一致造成的誤差。
5、抽樣的種類(lèi):簡(jiǎn)單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣、多階段抽樣
6、簡(jiǎn)單隨機(jī)抽樣
分類(lèi):不放回簡(jiǎn)單隨機(jī)抽樣;放回簡(jiǎn)單隨機(jī)抽樣。
最基本的隨機(jī)抽樣方法。問(wèn)題:效率不高,分布分散。
適用條件:抽樣框中沒(méi)有更多的可利用輔助信息;調(diào)查對(duì)象的分布范圍不廣;個(gè)體間的差異不是很大。
7、分層抽樣
先把總體分為不同的層,再在不同層內(nèi)獨(dú)立、隨機(jī)地抽取樣本。要有足夠的輔助信息,使得同一層差異小,不同層差異大。
特點(diǎn):不僅可以估計(jì)總體參數(shù),也可估計(jì)各層參數(shù);便于抽樣工作的組織;降低抽樣誤差。
樣本量在各層的分配方法:等比例分配,不等比例分配。
8、系統(tǒng)抽樣
按序排列,確定初始單元,等間隔抽取數(shù)據(jù)。分為按無(wú)關(guān)標(biāo)識(shí)排列和按有關(guān)標(biāo)識(shí)排列,后者精度更高。
方差估計(jì)比較復(fù)雜,給抽樣誤差帶來(lái)一定困難。
9、整群抽樣
步驟:劃分為互不重疊的群體,抽樣時(shí)直接抽取群,抽中的群調(diào)查全部,未抽中的群不調(diào)查。
如果群內(nèi)差異小,群間差異大,抽樣誤差會(huì)比較大;如果群內(nèi)差異大,群間差異小,誤差低于簡(jiǎn)單隨機(jī)抽樣,適合此類(lèi)群體的抽樣調(diào)查。
10、多階段抽樣
是指將抽樣過(guò)程分階段進(jìn)行,每個(gè)階段使用的抽樣方法往往不同,即將各種抽樣方法結(jié)合使用,在大規(guī)模調(diào)查中常用。
其實(shí)施過(guò)程為,先從總體中抽取范圍較大的單元,稱(chēng)為一級(jí)抽樣單元,再?gòu)拿總€(gè)抽得的一級(jí)單元中抽取范圍更小的二級(jí)單元,依此類(lèi)推,最后抽取其中范圍更小的單元作為調(diào)查單位。
多階段抽樣與分層抽樣、整群抽樣的關(guān)系:將總體分為若干個(gè)一階單元,如果在每一個(gè)一階單元中,都隨機(jī)抽取部分二階單元,由這些二階單元中的總體基本單元組成的樣本,在抽樣的方式上,就相當(dāng)于分層抽樣;如果在全部的一階單元中,只抽取了部分一階單元,并對(duì)抽中的一階單元中的所有的基本單元都做全面調(diào)查,這就是整群抽樣。
分層抽樣實(shí)際是第一階抽樣比為100%時(shí)的一種特殊的兩階抽樣;而整群抽樣實(shí)際上是第二階抽樣比為100%時(shí)的一種特殊的兩階抽樣,故也稱(chēng)單級(jí)整群抽樣。
11、估計(jì)量
①估計(jì)量的性質(zhì):無(wú)偏性(對(duì)不放回簡(jiǎn)單隨機(jī)抽樣,所有可能樣本均值取值的平均值等于總體均值),有效性(方差越小越有效),一致性(隨著樣本量的增大,估計(jì)量穩(wěn)定于總體參數(shù)的真值,則有一致性)。
12、抽樣誤差的估計(jì)
不放回簡(jiǎn)單隨機(jī)抽樣的估計(jì)量方差公式:
(因?qū)嵺`中S2未知,公式以s2替代S2)
公式的意義:①樣本差異越大,s2越大,則誤差越大;②樣本量n越大,則誤差越小。
13、樣本量的影響因素
①調(diào)查的精度:精度越大,樣本量越大;
②總體的離散程度:離散程度越大,樣本量越大;
③總體的規(guī)模:對(duì)小規(guī)模總體而言,總體規(guī)模越大, 樣本量越大,大規(guī)模不受影響;
④無(wú)回答的情況:無(wú)回答率越高,樣本量越大;
⑤經(jīng)費(fèi)的制約:樣本量是調(diào)查經(jīng)費(fèi)與調(diào)查精度之間的折中和平衡。