第二節(jié)、數(shù)值型數(shù)據(jù)的整理與顯示
本節(jié)考點(diǎn):
1.數(shù)據(jù)分組的方法
2.組中值的作用和計(jì)算方法
3.數(shù)據(jù)分組的具體步驟
4.直方圖與條形圖的區(qū)別
本節(jié)內(nèi)容:
【注】品質(zhì)數(shù)據(jù)的整理與圖示方法,也都適用于對數(shù)值型數(shù)據(jù)的整理與顯示。但數(shù)值型數(shù)據(jù)還有一些特定的整理和圖示方法,并不適用于品質(zhì)數(shù)據(jù)。
(一)數(shù)據(jù)的分組
1.數(shù)據(jù)分組的含義:
數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別。分組后再計(jì)算出各組中出現(xiàn)的次數(shù)或頻數(shù),形成一張頻數(shù)分布表。
2.數(shù)據(jù)分組的方法
分組的方法有單變量值分組和組距分組兩種。
(1)單變量值分組是把每一個(gè)變量值作為一組,這種分組方法通常只適合于離散變量且變量較少的情況。
(2)組距分組是將全部的變量值,劃分為若干個(gè)不同的區(qū)間。適合于連續(xù)變量或變量值較多的情況。
3.采用組距分組的步驟:
第一步,確定分組的組數(shù)
確定分組組數(shù)時(shí)的要求:
?、賱澐值慕M數(shù)既不應(yīng)太多也不應(yīng)太少;
?、诮M數(shù)的確定,要盡量保證組間資料的差異性與組內(nèi)資料的同質(zhì)性;
③采用的分組辦法,要能夠充分顯示客觀現(xiàn)象本身存在的狀態(tài)。
第二步,對原始資料進(jìn)行排序。
第三步,求極差。極差值=最大觀察值-最小觀察值
第四步,確定各組組距。
?、賹?shí)行等距分組情況下,組距=
組距與組數(shù)成反比例關(guān)系,組數(shù)越多,組距越小,組數(shù)越少,組距越大。
?、诮M距是每組觀察值的最大差,即每組的上限值與下限值之間的差。用公式表示就是:
組距=某組上限值-該組下限值
或:某組上限值=該組下限值+組距
某組下限值=該組上限值-組距
【例題13:2006年、2008年單選題】對數(shù)據(jù)實(shí)行等距分組的情況下,組距與組數(shù)的關(guān)系是()。
A.無任何關(guān)系
B.反比關(guān)系
C.正比關(guān)系
D.組距總是組數(shù)的5倍
【答案】B
【解析】組距=極差/組數(shù)
第五步,確定組限。
組限是組與組之間的界限,或者是每組觀察值的變化范圍。
一個(gè)組的最小值稱為下限;最大值稱為上限。
上限值與下限值的差值稱為組距
上限值與下限值的平均數(shù)稱為組中值。即:
確定組限時(shí)應(yīng)注意:
①第一組的下限值應(yīng)比最小的觀察值小一點(diǎn),最后一組的上限值應(yīng)比最大的觀察值大一點(diǎn)。
② 特別需要或不得已的情況除外,最好不要使用開口組。
?、?組限應(yīng)取得美觀些,按數(shù)字編好,組限值應(yīng)能被5除盡,且一般要用整數(shù)表示。
第六步,確定各組觀察值出現(xiàn)的頻數(shù)。
采取組距分組時(shí),需要遵循“不重不漏”原則。
為解決“不重”的問題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定“上組限不在內(nèi)”,即當(dāng)相鄰兩組的上下限重疊時(shí),恰好等于某一組上限的觀察值不算在本組內(nèi),而計(jì)算在下一組內(nèi)。
【例題14:2008年單選題】將一批數(shù)據(jù)進(jìn)行分組,各組的組限依次為“100-120”、“120-130”“130-140”“140-150”“150-160”,按統(tǒng)計(jì)分組的規(guī)定,140這一數(shù)值( )
A不計(jì)算在任何一組
B分在“140-150”這一組
C分在“130-140”這一組
D分在“130-140”或“140-150”均可
【答案】B
第七步,制作頻數(shù)分布表。
(二)數(shù)值型數(shù)據(jù)的圖示
1.直方圖
直方圖是用矩形的寬度和高度來表示頻數(shù)分布的圖形。
(1)等距分組的數(shù)據(jù), 用矩形的高度直接表示頻數(shù)的分布 。
(2)不等距分組的數(shù)據(jù),用矩形的面積表示各組的頻數(shù)分布。
實(shí)際上,無論是等距分組的數(shù)據(jù)還是不等距分組的數(shù)據(jù),用矩形的面積或頻數(shù)密度來表示各組的頻數(shù)分布更為合適。
(3)直方圖與條形圖不同:
①條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別是)則是固定的;
直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,因此其高度與寬度均有意義。
②由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。
2.折線圖(也稱為頻數(shù)多邊形圖)
折線圖也稱頻數(shù)多邊形圖,它是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)用直線連接起來,再把原來的直方圖抹掉就是折線圖。
【例題15:2006年多選題】直方圖與條形圖的區(qū)別在于()。
A.直方圖的各矩形通常是分開排列
B.直方圖用面積表示各組頻數(shù)的多少
C.直方圖的各矩形通常是連續(xù)排列
D.直方圖的矩形高度與寬度均有意義
E.直方圖的矩形高度有意義而寬度無意義
【答案】BCD
【例題16:2010年單選題】在直方圖中,矩形的寬度表示( )。
A.各組所屬的類別
B.各組的百分比
C.各組的頻數(shù)
D.各組的組距
【答案】D
【例題17:2011年單選題】在直方圖中,對于不等距分組的數(shù)據(jù),是用矩形的( )來表示各組頻數(shù)的多少。
A.高度
B.寬度
C.中心角度
D.面積
【答案】D