1.統計分組的意義
根據統計研究任務的要求和研究現象總體的內在特點,把現象總體按某一標志劃分為若干性質不同但又有聯系的幾個部分稱統計分組。
總體的變異性是統計分組的客觀依據。統計分組是總體內進行的一種定性分類,它把總體劃分為一個個性質不同的范圍更小的總體。
總體經過分組以后,各組內部的差異縮小趨于同質,組與組之間的差異拉以表明現象間質的差別或量的不同。
2.統計分組的種類
①統計分組按其任務和作用不同,分為類型分組、結構分組和分析分組。
②統計分組按分組標志的多少分為簡單分組和復合分組。
③統計分組按分組標志的性質分為品質分組和變量分組。
3.分組體系與分組標志的選擇
①分組體系
統計分組后所形成的一系列互相聯系、互相補充的組的整體稱分組體系。分組體系有平行分組體系和復合分組體系兩種。
②分組標志的選擇
分組標志的選擇是統計分組的關鍵。
正確選擇分組標志,必須根據統計研究的任務目的,抓住反映現象本質區別和內在聯系的標志作為分組標志。
4.統計分組的方法
(1)品質標志分組方法
品質標志分組一般較簡單,分組標志一旦確定,組數、組名、組與組之間的界限也就確定。有些復雜的品質標志分組可根據統一規定的劃分標準和分類目錄進行。
(2)數量標質分組方法
按數量標志分組的目的并不是單純確定各組在數量上的差別,而是要通過數量上的變化來區分各組的不同類型和性質。
①單項式分組和組距式分組
離散變量如果變量值的變動幅度小,就可以一個變量值對應一組,稱單項式分組。
離散變量如果變量值的變動幅度很,變量值的個數很多,則把整個變量值依次劃分為幾個區間,各個變量值則按其小確定所歸并的區間,區間的距離稱為組距,這樣的分組稱為組距式分組。
連續變量由于不能一一列舉其變量值,只能采用組距式的分組方式,且相鄰的組限必須重疊。
②等距分組和不等距分組
等距分組是各組保持相等的組距,也就是說各組標志值的變動都限于相同的范圍。不等距分組即各組組距不相等的分組。
統計分組時采用等距分組還是不等距分組,取決于研究對象的性質特點。在標志值變動比較均勻的情況下宜采用等距分組。等距分組便于各組單位數和標志值直接比較,也便于計算各項綜合指標。在標志值變動很不均勻的情況下宜采用不等距分組。不等距分組有時更能說明現象的本質特征。
③組限和組中值
組距兩端的數值稱組限。其中,每組的起點數值稱為下限,每組的終點數值稱為上限。上限和下限的差稱組距,表示各組標志值變動的范圍。
組中值是上下限之間的中點數值,以代表各組標志值的一般水平。
一般情況下,組中值=(上限+下限)÷2
對于第一組是“多少以下”,最后一組“多少以上”的開口組,組中值的計算可參照鄰組的組距來決定。即:缺下限開口組組中值=上限—1/2鄰組組距,缺上限開口組組中值=下限+1/2鄰組組距。
【】★【】