第五章 相關(guān)分析與回歸分析
相關(guān)分析是研究兩個(gè)或兩個(gè)以上變量之間相關(guān)關(guān)系的方法論,而回歸分析是研究變量之間相關(guān)關(guān)系類型,進(jìn)而掌握其發(fā)展變化規(guī)律,預(yù)測未來的方法論。
第一節(jié) 相關(guān)關(guān)系
一.相關(guān)關(guān)系
在現(xiàn)實(shí)世界中,任何事物或現(xiàn)象都不是孤立存在的,而是相互聯(lián)系、相互制約、相互依存的。當(dāng)某些現(xiàn)象發(fā)生變化時(shí),另一現(xiàn)象也會隨之發(fā)生變化。如商品價(jià)格的變化會刺激或抑制商品銷售量的變化;勞動力素質(zhì)的高低會影響企業(yè)的效益;直接材料、直接人工的價(jià)格變化會對產(chǎn)品銷售成本有直接的影響;居民收入的高低會影響對該企業(yè)產(chǎn)品的需求量等等。
研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對經(jīng)搜集、整理過的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,為客觀、科學(xué)地統(tǒng)計(jì)提供依據(jù)。
現(xiàn)象間的依存關(guān)系大致可以分成兩種類型: 一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系。
(1)函數(shù)關(guān)系。函數(shù)是指現(xiàn)象之間有一種嚴(yán)格的確定性的依存關(guān)系。表現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,而且有確定的值與之相對應(yīng)。例如,銀行的1年期存款利率為年息1.98%,存入的本金用x表示,到期本息用y表示,則y=x+1.98%x(不考慮利息稅);
(2)相關(guān)關(guān)系。相關(guān)關(guān)系是指客觀現(xiàn)象之間確實(shí)存在的,但數(shù)量上不是嚴(yán)格對應(yīng)的依存關(guān)系。在這種關(guān)系中,對于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對應(yīng)。例如成本的高低與利潤的多少有密切關(guān)系,但某一確定的成本與相對應(yīng)的利潤的數(shù)量關(guān)系卻是不確定的。這是因?yàn)橛绊懤麧櫟囊蛩爻顺杀就猓有價(jià)格、供求平衡、消費(fèi)嗜好等因素以及其他偶然因素的影響
相關(guān)關(guān)系和函數(shù)關(guān)系既有區(qū)別,又有聯(lián)系。有些函數(shù)關(guān)系往往因?yàn)橛杏^察或測量誤差以及各種隨機(jī)因素的干擾等原因,在實(shí)際中常常通過相關(guān)關(guān)系表現(xiàn)出來;而在研究相關(guān)關(guān)系時(shí),當(dāng)對其數(shù)量間的規(guī)律性了解得越深刻的時(shí)候,其相關(guān)關(guān)系就越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來表現(xiàn)。
(3)相關(guān)關(guān)系的兩個(gè)特點(diǎn)
、佻F(xiàn)象之間確實(shí)存在著數(shù)量上的依存關(guān)系。就是說,一個(gè)現(xiàn)象發(fā)生數(shù)量上的變化,另一個(gè)現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化。
、诂F(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一個(gè)現(xiàn)象發(fā)生數(shù)量上的變化,另一個(gè)現(xiàn)象會有幾個(gè)可能值與之對應(yīng),而不是唯一確定的值。
相關(guān)分析的主要內(nèi)容:
(1)確定現(xiàn)象之間有無關(guān)系。
(2)確定相關(guān)關(guān)系的表現(xiàn)形式,運(yùn)用相應(yīng)的回歸分析方法進(jìn)一步分析現(xiàn)象之間的數(shù)量依存關(guān)系。用一個(gè)數(shù)學(xué)表達(dá)式,來反映有相關(guān)關(guān)系的變量之間的數(shù)值變化關(guān)系,據(jù)此由一個(gè)或若干個(gè)自變量的數(shù)值推斷出因變量的可能值,這種分析稱為回歸分析。相關(guān)分析與回歸分析既有區(qū)別又有聯(lián)系,兩種分析構(gòu)成了相關(guān)關(guān)系分析的基本內(nèi)容。
(3)測定相關(guān)關(guān)系的密切程度。
二.相關(guān)關(guān)系的描述---散點(diǎn)圖
對于兩個(gè)變量x和y,通過觀察或?qū)嶒?yàn),我們可以得到若干組數(shù)據(jù),記為(xi,yi)(i=1,2,…,n)將這些數(shù)據(jù)按x值由大到小(或由小到大)以序列表表示,即構(gòu)成相關(guān)表。
將一一對應(yīng)的(xi,yi)描點(diǎn)于坐標(biāo)軸上,即構(gòu)成散點(diǎn)圖,又稱相關(guān)圖。通過散點(diǎn)圖所反映出的坐標(biāo)點(diǎn)的分布狀況可以直觀地判斷變量之間是否存在相關(guān)關(guān)系,以及相關(guān)的形態(tài)、方向。例如:
散點(diǎn)圖是相關(guān)關(guān)系的一種描述方法,它直觀、形象,通過散點(diǎn)圖可以觀察到現(xiàn)象的關(guān)系類型以及相關(guān)方向、程度。
1. 相關(guān)的形態(tài)
按照相關(guān)形式不同分為:線性相關(guān)和非線性相關(guān)。
線性相關(guān)——又稱直線相關(guān),是指當(dāng)一個(gè)變量變動時(shí),另一變量隨之發(fā)生大致均等的變動,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條直線;例如,人均消費(fèi)水平與人均收入水平通常呈線性關(guān)系。
非線性相關(guān)——一個(gè)變量變動時(shí),另一變量也隨之發(fā)生變動,但這種變動不是均等的,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線相關(guān)。例如,工人加班加點(diǎn)在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。
2. 相關(guān)的方向
按照相關(guān)的方向不同分為:正相關(guān)和負(fù)相關(guān)。
正相關(guān)——當(dāng)一個(gè)變量的值增加或減少,另一個(gè)變量的值也隨之增加或減少。如工人勞動生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費(fèi)水平隨個(gè)人所支配收入的增加而增加。
負(fù)相關(guān)——當(dāng)一個(gè)變量的值增加或減少時(shí),另一變量的值反而減少或增加。如商品流轉(zhuǎn)額越大,商品流通費(fèi)用越低;利潤隨單位成本的降低而增加。
三.相關(guān)程度的測定:
在直線相關(guān)的類型中,人們使用相關(guān)系數(shù)測定變量之間的相關(guān)關(guān)系。
(一) 相關(guān)系數(shù)的計(jì)算
相關(guān)系數(shù)是測定變量之間關(guān)系密切程度的量。對兩個(gè)變量之間的線性相關(guān)程度的度量稱為單相關(guān)系數(shù)。通常以r表示樣本的相關(guān)系數(shù)。
樣本的相關(guān)系數(shù)的定義公式為:
計(jì)算該相關(guān)系數(shù)時(shí),假定兩個(gè)變量之間是線性關(guān)系,而且兩個(gè)變量都是隨機(jī)變量。此外,樣本數(shù)據(jù)中不應(yīng)有極端值,否則會對相關(guān)系數(shù)的值有較大影響。相關(guān)系數(shù)的性質(zhì)如下:
1. 相關(guān)系數(shù)的值介于–1與+1之間,即–1≤r≤+1。
當(dāng)r>0時(shí),表示兩變量正相關(guān),當(dāng)r<0時(shí),表示兩變量為負(fù)相關(guān)。當(dāng)|r|=1時(shí),表示兩變量為完全線性相關(guān)即函數(shù)關(guān)系。當(dāng)r=1時(shí),稱為完全正相關(guān),而當(dāng)r=-1時(shí),稱為完全負(fù)相關(guān)。當(dāng)r=0時(shí),表示兩變量間無線性相關(guān)關(guān)系。
2. r具有對稱性。X與y之間的相關(guān)系數(shù)rxy和y與x之間的相關(guān)系數(shù)ryx相等。
3. r數(shù)值大小與x和y的數(shù)據(jù)原點(diǎn)及計(jì)量尺度無關(guān)。改變x和y的數(shù)據(jù)原點(diǎn)和計(jì)量尺度,并不改變r(jià)數(shù)值的大小。
4. r僅僅是x與y 之間線性關(guān)系的一個(gè)度量,它不能用于描述非線性關(guān)系。
5. r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量,卻不一定意味著x與y一定有因果關(guān)系。
當(dāng)︱r︱≥0.8時(shí),可視為高度相關(guān);當(dāng)0.5≤︱r︱<0.8時(shí),可視為中度相關(guān);當(dāng)0.3≤︱r︱<0.5時(shí),視為低度相關(guān);當(dāng)︱r︱<0.3時(shí),說明兩個(gè)變量之間的相關(guān)程度極弱。
(二)相關(guān)系數(shù)的檢驗(yàn):
檢驗(yàn)相關(guān)系數(shù)是因?yàn)閮蓚(gè)變量均為隨機(jī)變量,計(jì)算相關(guān)系數(shù)時(shí)使用的是它們的隨機(jī)抽樣值,因此不能斷定總體變量值也存在著這樣的相關(guān)關(guān)系,需要經(jīng)過顯著性檢驗(yàn)加以確定。
在實(shí)際的客觀分析中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計(jì)算的,因而帶有一定的隨機(jī)性。樣本容量越小其可信度就越差,因此也需要進(jìn)行檢驗(yàn)。相關(guān)系數(shù)的顯著性檢驗(yàn)問題是對總體的相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn)。
表明相關(guān)系數(shù)在統(tǒng)計(jì)上是顯著的。即人均消費(fèi)性支出與人均可支配收入之間存在顯著的線性相關(guān)系數(shù)。
上一篇:初級統(tǒng)計(jì)師考試《統(tǒng)計(jì)實(shí)務(wù)》重要考點(diǎn):第四章第三節(jié)
下一篇:初級統(tǒng)計(jì)師考試《基礎(chǔ)知識》考點(diǎn)歸納:統(tǒng)計(jì)資料保密原則
初級會計(jì)職稱中級會計(jì)職稱經(jīng)濟(jì)師注冊會計(jì)師證券從業(yè)銀行從業(yè)會計(jì)實(shí)操統(tǒng)計(jì)師審計(jì)師高級會計(jì)師基金從業(yè)資格稅務(wù)師資產(chǎn)評估師國際內(nèi)審師ACCA/CAT價(jià)格鑒證師統(tǒng)計(jì)資格從業(yè)
一級建造師二級建造師消防工程師造價(jià)工程師土建職稱公路檢測工程師建筑八大員注冊建筑師二級造價(jià)師監(jiān)理工程師咨詢工程師房地產(chǎn)估價(jià)師 城鄉(xiāng)規(guī)劃師結(jié)構(gòu)工程師巖土工程師安全工程師設(shè)備監(jiān)理師環(huán)境影響評價(jià)土地登記代理公路造價(jià)師公路監(jiān)理師化工工程師暖通工程師給排水工程師計(jì)量工程師
人力資源考試教師資格考試出版專業(yè)資格健康管理師導(dǎo)游考試社會工作者司法考試職稱計(jì)算機(jī)營養(yǎng)師心理咨詢師育嬰師事業(yè)單位教師招聘公務(wù)員公選考試招警考試選調(diào)生村官
執(zhí)業(yè)藥師執(zhí)業(yè)醫(yī)師衛(wèi)生資格考試衛(wèi)生高級職稱護(hù)士資格證初級護(hù)師主管護(hù)師住院醫(yī)師臨床執(zhí)業(yè)醫(yī)師臨床助理醫(yī)師中醫(yī)執(zhí)業(yè)醫(yī)師中醫(yī)助理醫(yī)師中西醫(yī)醫(yī)師中西醫(yī)助理口腔執(zhí)業(yè)醫(yī)師口腔助理醫(yī)師公共衛(wèi)生醫(yī)師公衛(wèi)助理醫(yī)師實(shí)踐技能內(nèi)科主治醫(yī)師外科主治醫(yī)師中醫(yī)內(nèi)科主治兒科主治醫(yī)師婦產(chǎn)科醫(yī)師西藥士/師中藥士/師臨床檢驗(yàn)技師臨床醫(yī)學(xué)理論中醫(yī)理論