發(fā)布時(shí)間:2010-01-19 共1頁(yè)
相關(guān)分析與回歸分析
一、本講要求
(一)相關(guān)關(guān)系的概念和種類
熟悉相關(guān)關(guān)系的基本概念和特點(diǎn);
熟悉相關(guān)關(guān)系的種類;
(二)相關(guān)分析
熟悉相關(guān)關(guān)系的描述方法——相關(guān)表與相關(guān)圖;
熟悉相關(guān)系數(shù)的含義、相關(guān)系數(shù)的特點(diǎn);
熟悉相關(guān)系數(shù)的計(jì)算方法和相關(guān)系數(shù)的顯著性檢驗(yàn)方法。
(三)回歸分析的概念
熟悉回歸分析的概率和回歸分析包括的主要內(nèi)容;
熟悉回歸分析與相關(guān)分析的區(qū)別
二、本講內(nèi)容
(一) 相關(guān)關(guān)系的概念與種類
1.相關(guān)關(guān)系的概念
在現(xiàn)實(shí)世界中,任何事物或現(xiàn)象都不是孤立存在的,而是相互聯(lián)系、相互制約、相互依存的。當(dāng)某些現(xiàn)象發(fā)生變化時(shí),另一現(xiàn)象也會(huì)隨之發(fā)生變化。如商品價(jià)格的變化會(huì)刺激或抑制商品銷售量的變化;勞動(dòng)力素質(zhì)的高低會(huì)影響企業(yè)的效益;直接材料、直接人工的價(jià)格變化會(huì)對(duì)產(chǎn)品銷售成本有直接的影響;居民收入的高低會(huì)影響對(duì)該企業(yè)產(chǎn)品的需求量等等。研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對(duì)經(jīng)搜集、整理過的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,為客觀、科學(xué)地統(tǒng)計(jì)提供依據(jù)。
現(xiàn)象間的依存關(guān)系致可以分成兩種類型: 一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系。
(1)函數(shù)關(guān)系。函數(shù)是指現(xiàn)象之間有一種嚴(yán)格的確定性的依存關(guān)系。表現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,而且有確定的值與之相對(duì)應(yīng)。例如,銀行的1年期存款利率為年息1.98%,存入的本金用x表示,到期本息用y表示,則y=x+1.98%x(不考慮利息稅);再如,某種股票的成交額Y與該股票的成交量X、成交價(jià)格P之間的關(guān)系可以用Y=PX來表示,這都是函數(shù)關(guān)系。
(2)相關(guān)關(guān)系。相關(guān)關(guān)系是指客觀現(xiàn)象之間確實(shí)存在的,但數(shù)量上不是嚴(yán)格對(duì)應(yīng)的依存關(guān)系。在這種關(guān)系中,對(duì)于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對(duì)應(yīng)。例如成本的高低與利潤(rùn)的多少有密切關(guān)系,但某一確定的成本與相對(duì)應(yīng)的利潤(rùn)的數(shù)量關(guān)系卻是不確定的。這是因?yàn)橛绊懤麧?rùn)的因素除了成本外,還有價(jià)格、供求平衡、消費(fèi)嗜好等因素以及其他偶然因素的影響;再如,生育率與人均GDP的關(guān)系也屬于典型的相關(guān)關(guān)系:人均GDP高的國(guó)家,生育率往往較低,但二者沒有惟一確定的關(guān)系,這是因?yàn)槌私?jīng)濟(jì)因素外,生育水平還受教育水平、城市化水平以及不易測(cè)量的民族風(fēng)俗、宗教和其他隨機(jī)因素的共同影響。
具有相關(guān)關(guān)系的某些現(xiàn)象可表現(xiàn)為因果關(guān)系,即某一或若干現(xiàn)象的變化是引起另一現(xiàn)象變化的原因,它是可以控制、給定的值,將其稱為自變量;另一個(gè)現(xiàn)象的變化是自變量變化的結(jié)果,它是不確定的值,將其稱為因變量。如資金投入與產(chǎn)值之間,前者為自變量,后者為因變量。但具有相關(guān)關(guān)系的現(xiàn)象并不都表現(xiàn)為因果關(guān)系,如生產(chǎn)費(fèi)用和生產(chǎn)量、商品的供求與價(jià)格等。這是由于相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。
相關(guān)關(guān)系和函數(shù)關(guān)系既有區(qū)別,又有聯(lián)系。有些函數(shù)關(guān)系往往因?yàn)橛杏^察或測(cè)量誤差以及各種隨機(jī)因素的干擾等原因,在實(shí)際中常常通過相關(guān)關(guān)系表現(xiàn)出來;而在研究相關(guān)關(guān)系時(shí),當(dāng)對(duì)其數(shù)量間的規(guī)律性了解得越深刻的時(shí)候,其相關(guān)關(guān)系就越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來表現(xiàn)。
(3)相關(guān)關(guān)系的兩個(gè)特點(diǎn)
①現(xiàn)象之間確實(shí)存在著數(shù)量上的依存關(guān)系。就是說,一個(gè)現(xiàn)象發(fā)生數(shù)量上的變化,另一個(gè)現(xiàn)象也會(huì)相應(yīng)地發(fā)生數(shù)量上的變化。
②現(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一個(gè)現(xiàn)象發(fā)生數(shù)量上的變化,另一個(gè)現(xiàn)象會(huì)有幾個(gè)可能值與之對(duì)應(yīng),而不是唯一確定的值。
2.相關(guān)關(guān)系的種類
現(xiàn)象之間的相關(guān)關(guān)系從不同的角度可以區(qū)分為不同類型。
(1)按照相關(guān)的方向不同分為:正相關(guān)和負(fù)相關(guān)。
正相關(guān)——當(dāng)一個(gè)變量的值增加或減少,另一個(gè)變量的值也隨之增加或減少。如工人勞動(dòng)生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費(fèi)水平隨個(gè)人所支配收入的增加而增加。
負(fù)相關(guān)——當(dāng)一個(gè)變量的值增加或減少時(shí),另一變量的值反而減少或增加。如商品流轉(zhuǎn)額越,商品流通費(fèi)用越低;利潤(rùn)隨單位成本的降低而增加。
(2) 按照相關(guān)形式不同分為:線性相關(guān)和非線性相關(guān)。
線性相關(guān)——又稱直線相關(guān),是指當(dāng)一個(gè)變量變動(dòng)時(shí),另一變量隨之發(fā)生致均等的變動(dòng),從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條直線;例如,人均消費(fèi)水平與人均收入水平通常呈線性關(guān)系。
非線性相關(guān)——一個(gè)變量變動(dòng)時(shí),另一變量也隨之發(fā)生變動(dòng),但這種變動(dòng)不是均等的,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線相關(guān)。例如,工人加班加點(diǎn)在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。
(3)按相關(guān)程度分為:完全相關(guān)、不完全相關(guān)和不相關(guān)。
完全相關(guān)——當(dāng)一個(gè)變量的數(shù)量完全由另一個(gè)變量的數(shù)量變化所確定時(shí),二者之間即為完全相關(guān)。例如,在價(jià)格不變的條件下,銷售額與銷售量之間的正比例函數(shù)關(guān)系即為完全相關(guān),此時(shí)相關(guān)關(guān)系便成為函數(shù)關(guān)系,因此也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個(gè)特例。
不相關(guān)——又稱零相關(guān),當(dāng)變量之間彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),則變量之間為不相關(guān)。例如,股票價(jià)格的高低與氣溫的高低一般情況下是不相關(guān)的。
不完全相關(guān)——如果兩個(gè)變量的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。由于完全相關(guān)和不相關(guān)的數(shù)量關(guān)系是確定的或相互獨(dú)立的,因此統(tǒng)計(jì)學(xué)中相關(guān)分析的主要研究對(duì)象是不完全相關(guān)。
(4)按研究的變量(或因素)的多少分為:?jiǎn)蜗嚓P(guān)、復(fù)相關(guān)和偏相關(guān)。
單相關(guān)——又稱一元相關(guān),是指兩個(gè)變量之間的相關(guān)關(guān)系,如廣告費(fèi)支出與產(chǎn)品銷售量之間的相關(guān)關(guān)系;
復(fù)相關(guān)——又稱多元相關(guān),是指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系,如商品銷售額與居民收入、商品價(jià)格之間的相關(guān)關(guān)系。
偏相關(guān)——在一個(gè)變量與兩個(gè)或兩個(gè)以上的變量相關(guān)的條件下,當(dāng)假定其他變量不變時(shí),其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相關(guān)。例如,在假定商品價(jià)格不變的條件下,該商品的需求量與消費(fèi)者收入水平的相關(guān)關(guān)系即為偏相關(guān)。
3.相關(guān)關(guān)系分析的基本內(nèi)容
統(tǒng)計(jì)對(duì)現(xiàn)象之間相關(guān)關(guān)系的分析,主要從兩方面進(jìn)行:一是測(cè)定變量之間的相關(guān)關(guān)系的密切程度,稱為相關(guān)分析;另一是根據(jù)變量之間的關(guān)系形式,用一個(gè)數(shù)學(xué)表達(dá)式,來反映有相關(guān)關(guān)系的變量之間的數(shù)值變化關(guān)系,據(jù)此由一個(gè)或若干個(gè)自變量的數(shù)值推斷出因變量的可能值,這種分析稱為回歸分析。相關(guān)分析與回歸分析既有區(qū)別又有聯(lián)系,兩種分析構(gòu)成了相關(guān)關(guān)系分析的基本內(nèi)容。
(二)相關(guān)分析
1.相關(guān)分析的描述——相關(guān)表與相關(guān)圖
在進(jìn)行相關(guān)分析之前,首先要判斷現(xiàn)象之間是否存在相關(guān)關(guān)系,是何種形式的相關(guān)關(guān)系。這種判斷,最初是要對(duì)研究對(duì)象進(jìn)行定性分析,在初步確認(rèn)有相關(guān)關(guān)系后,還要運(yùn)用量的實(shí)際觀察資料,編出相關(guān)表、繪出相關(guān)圖,利用相關(guān)圖表,再進(jìn)一步判斷相關(guān)關(guān)系的形式,為相關(guān)分析奠定基礎(chǔ)。
3.簡(jiǎn)單線性相關(guān)分析的特點(diǎn)
(1)相關(guān)分析主要是計(jì)算一個(gè)統(tǒng)計(jì)指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
(2)分析時(shí)把兩個(gè)變量的地位可以看成是對(duì)等的,不用分哪個(gè)是自變量,哪個(gè)是因變量。直接根據(jù)兩個(gè)變量的數(shù)值即可計(jì)算相關(guān)系數(shù);
(3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個(gè)。
(4)相關(guān)系數(shù)有正負(fù)號(hào),表示相關(guān)的方向;
(5)計(jì)算相關(guān)系數(shù)時(shí),所需的兩個(gè)變量的資料都可以是隨機(jī)的。
(三)回歸分析的概念
1.回歸分析的概念
計(jì)算相關(guān)系數(shù)只能說明現(xiàn)象間相關(guān)關(guān)系的方向和程度,關(guān)系密切與否,但不能說明一個(gè)現(xiàn)象發(fā)生一定量的變化,另一個(gè)現(xiàn)象一般也會(huì)發(fā)生多的變化。如銷售收入每增加一萬元時(shí),銷售利潤(rùn)一般會(huì)增加多少?施肥量增加一斤,一般地會(huì)增加多少產(chǎn)量?
為了測(cè)定現(xiàn)象之間數(shù)量變化上的一般關(guān)系要使用數(shù)學(xué)方法,這類數(shù)學(xué)方法稱為回歸分析。“回歸”這個(gè)詞的意思,就是指的變量之間的一般數(shù)量關(guān)系。根據(jù)現(xiàn)象之間相關(guān)關(guān)系的表現(xiàn)形式,配合一條直線或曲線,用這條直線或曲線來代表自變量和因變量相隨變動(dòng)的一般數(shù)量關(guān)系。也就是要建立并求解直線或曲線的數(shù)學(xué)方程式,從而求得變量間的一般關(guān)系值。
回歸有不同種類,按照自變量的個(gè)數(shù)分,有一元回歸和多元回歸。只有一個(gè)自變量的叫一元回歸,有兩個(gè)或兩個(gè)以上自變量的叫多元回歸;按照回歸曲線的形態(tài)分,有線性(直線)回歸和非線性(曲線)回歸。實(shí)際分析時(shí)應(yīng)根據(jù)客觀現(xiàn)象的性質(zhì)、特點(diǎn)、研究目的和任務(wù)選取回歸分析的方法。本節(jié)僅討論一元線性回歸分析。
與直線相關(guān)分析的特點(diǎn)相比,簡(jiǎn)單直線回歸分析有以下特點(diǎn)。
(1)兩個(gè)變量之間不是對(duì)等關(guān)系,一個(gè)是自變量,一個(gè)是因變量,在進(jìn)行回歸分析時(shí),首先加以確定。
(2)相關(guān)系數(shù)是個(gè)抽象的系數(shù),而回歸方程是利用自變量的給定值來推算因變量值,它反映的是變量之間的具體的變動(dòng)關(guān)系。
(3)有些現(xiàn)象因果關(guān)系不明顯,x、y兩個(gè)變量可以互換,從方程式看,存在著兩個(gè)回歸方程:一個(gè)是以x為自變量,y為因變量,求出的回歸方程稱“y倚x回歸方程”;另一個(gè)是以y為自變量,x為因變量,求出的回歸方程稱“x倚 y回歸方程”。畫出圖來,是兩條斜率不同的回歸直線。
(4)直線回歸方程中的回歸系數(shù)也有正負(fù)號(hào),回歸系數(shù)為正號(hào),表示兩個(gè)變量之間的變動(dòng)方向相同,為負(fù)號(hào)則表示兩變量之間的變動(dòng)方向相反。
(5)回歸分析中的自變量是給定數(shù)值,不是隨機(jī)的,而因變量是隨機(jī)的,代入給定的自變量值,求出因變量的估計(jì)值,這個(gè)估計(jì)值是許多可能數(shù)值的平均值,存在著估計(jì)標(biāo)準(zhǔn)誤差。
2.相關(guān)分析與回歸分析的關(guān)系
相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒有對(duì)變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進(jìn)行回歸分析,很容易造成“虛假回歸”。與此同時(shí),相關(guān)分析只研究變量之間相關(guān)的方向和程度,不能推斷變量之間相互關(guān)系的具體形式,也無法從一個(gè)變量的變化來推測(cè)另一個(gè)變量的變化情況,因此,在具體應(yīng)用過程中,只有把相關(guān)分析和回歸分析結(jié)合起來,才能達(dá)到研究和分析的目的。
二者的區(qū)別主要體現(xiàn)在以下三個(gè)方面:
1.相關(guān)分析主要通過相關(guān)系數(shù)來判斷兩個(gè)變量之間是否存在著相互關(guān)系及其關(guān)系的密切程度,其前提條件是兩個(gè)變量都是隨機(jī)變量,且變量之間不必區(qū)別自變量和因變量。而回歸分析研究一個(gè)隨機(jī)變量(Y)與另一個(gè)非隨機(jī)變量(X)之間的相互關(guān)系,且變量之間必須區(qū)別自變量和因變量。
2.相關(guān)系數(shù)只能觀察變量間相關(guān)關(guān)系的密切程度和方向,不能估計(jì)推算具體數(shù)值。而回歸分析可以根據(jù)回歸方程,用自變量數(shù)值推算因變量的估計(jì)值。
3.互為因果關(guān)系的兩個(gè)變量,可以擬合兩個(gè)回歸方程,且互相獨(dú)立、不能互相替換。而相關(guān)系數(shù)卻只有一個(gè),即自變量與因變量互換相關(guān)系數(shù)不變。
需要指出的是,變量之間是否存在“真實(shí)相關(guān)”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關(guān)分析和回歸分析只是定量分析的手段,通過相關(guān)分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準(zhǔn)確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關(guān)系。因此,在具體應(yīng)用過程中,一定要始終注意把定性分析和定量分析結(jié)合起來,在準(zhǔn)確的定性分析的基礎(chǔ)上展開定量分析。