首頁 > 文章中心 > 人口統計學變量分析

      人口統計學變量分析

      前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇人口統計學變量分析范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

      人口統計學變量分析

      人口統計學變量分析范文第1篇

      【關鍵詞】父親;教養投入;幼兒

      【中圖分類號】G616 【文獻標識碼】A 【文章編號】1004-4604(2016)09-0045-5

      在中國傳統文化背景下,“男主外,女主內”通常是一般家庭的角色分工模式,因此,養育孩子更多地被看成是母親的事,大多數父親習慣做“甩手掌柜”。但隨著社會的變遷,越來越多的女性走出了家門,走上了工作崗位,于是,要求父親更多地參與到孩子的教養中來的呼聲日漸大起來。父親對孩子的成長具有獨特的影響。〔1〕在某些行為特質上,父親的影響甚至要大于母親。〔2〕例如,父親能夠影響孩子的社會性發展、認知發展和學業成就,〔3〕對孩子性別意識的形成也具有重要影響。父親參與的缺失,不僅可能會影響孩子性別意識的發展,還可能導致孩子交往能力的欠缺,甚至出現行為。〔4〕因此,對于父親的教養投入展開研究十分必要。那么,父親的教養投入現狀如何?父親教養投入的影響因素有哪些?

      一、研究設計

      (一)研究對象

      本研究采用方便取樣方法,從湖北省武漢市抽取了4所幼兒園,每所幼兒園各抽取小中大班3個班級為研究對象,共發放問卷300份,回收292份,有效問卷280份,有效問卷率為93.3%。

      (二)研究方法

      1.人口統計學變量分析

      本研究對幼兒及其父親的人口統計學信息進行了統計分析,包括幼兒的年齡、性別、是否為獨生子女,幼兒父親的年齡、受教育程度、月收入、每周工作時長、工作滿意度等。

      2.父親教養投入問卷調查

      本研究采用伍新春、劉暢等編制的《父親教養投入問卷》進行問卷調查,〔5〕問卷涉及互動性、可及性和責任性3個維度。互動性是指父親參與照顧孩子,包含生活照顧、學業支持、情感交流、規則引導和休閑活動5個子維度;可及性是指父親和孩子未發生直接互動,但當孩子需要的時候,父親能夠做出反應,包含空間可及和心理可及2個子維度;責任性是指父親為孩子長遠發展所做的準備、積累、規劃和支持等,包括榜樣示范、父職成長、信息獲得、教養支持和發展規劃5個子維度。〔6〕問卷共56個題項,適用于3~18歲兒童和青少年的父親。問卷采用0~4級評分,依次表示“從不”“偶爾”“有時”“經常”和“總是”。研制者報告,總問卷的Cronbach’s alpha系數為0.967,探索性因子分析KMO系數為0.943,表明問卷具有良好的統一性和內部一致性。互動性、可及性、責任性3個維度的Cronbach’s alpha系數都在0.867以上,12個子維度的Cronbach’s alpha系數也都在0.649以上。

      二、研究結果與分析

      (一)幼兒父親教養投入的總體情況

      幼兒父親教養投入的總體得分為2.67分,各維度的得分均大于2分,其中,可及性得分最高,互動性得分最低。對互動性、可及性和責任性3個維度分別作兩兩T檢驗,結果顯示,互動性

      (二)幼兒人口統計學變量對父親教養投入的影響

      統計分析表明,幼兒的年齡和性別對父親的教養投入均沒有顯著影響,獨生子女和非獨生子女父親的教養投入具有明顯差異(見表2)。

      進一步檢驗幼兒性別、年齡和是否是獨生子女三因素之間的交互效應,結果顯示,年齡、性別和是否是獨生子女的三重交互作用對父親教養投入的總得分有邊緣顯著效應(F=2.218,p=0.053),在可及性(F=2.615,p=0.025)和責任性(F=2.561,p=0.028)兩個維度上存在顯著差異,互動性差異不顯著。以可及性、責任性兩個維度為因變量,對幼兒年齡、性別和是否是獨生子女三因素的交互作用進行簡單效應分析,結果見表3。

      (三)父親人口統計學變量對其教養投入的影響

      統計分析表明,受教育程度、每周工作時長和工作滿意度對幼兒父親的教養投入有顯著影響。

      1.受教育程度

      學歷層次越高,父親的教養投入得分越高。其中,本科學歷和研究生及以上學歷的父親得分沒有顯著差異,但在互動性(F=2.324,p=0.057)上邊緣差異顯著。進一步分析表明,在學業支持(F=2.470,p=0.045)、休閑活動(F=2.671,p=0.033)和心理可及(F=2.551,p=0.040)上,不同學歷層次父親的教養投入存在顯著差異,學歷層次越高,教養投入越多。

      人口統計學變量分析范文第2篇

      關鍵詞:商業銀行;績效考評;員工滿意度

      一、 問題的提出

      一些文獻對商業銀行績效考評指標的體系設計問題進行了討論,但這些討論的重點是如何對銀行的經營績效進行評價,可以對不同銀行按績效進行排名,而沒有關注銀行績效評價的對象和主體即員工績效。另外一些文獻則以企業經營戰略目標為考核依據,以平衡計分卡(BSC)為考核工具,討論了以戰略目標為導向、以員工績效為考核對象的商業銀行員工績效考評指標體系的設計問題。這一類研究的基本思路大致相同:以BSC的基本框架為理論依據,明確銀行的戰略目標以后,將財務層面、客戶層面、內部流程、學習與成長等四個一級指標進行分解,形成二級指標、三級指標和權重,實際考核時對照指標體系對部門和員工進行打分和計算,即可得出考核對象的業績表現。但是,相關研究基本都屬定性研究,并沒有嚴格的計量檢驗的證據。

      沒有效率導向的企業經營績效考核,就不會有效率導向的員工績效考核。在商業銀行競爭壓力越來越大的情況下,基于效率(Efficient)和效果(Effects)的員工績效考評已經成為各銀行激勵員工努力工作、提升銀行競爭力的一種手段。尤其是在外資銀行不斷進入,新的銀行經營模式和管理理念不斷對傳統的中資銀行造成沖擊的情況下,一些新近成立的股份制商業銀行開始嘗試以管理會計系統為藍本的績效考核體系,強調“價值創造”理念,固化“成本倒逼”機制,徹底實現商業銀行員工績效考核的市場化轉型。管理會計系統是多維度的盈利核算系統,可以提供多維度的利潤指標,用以支持績效管理,因此,績效管理是管理會計主要用途之一。借助于管理會計系統進行業績評價,利用管理會計的利潤指標體系構建“價值創造型”的績效考核體系,能夠促使考核由規模導向轉為利潤導向,促使企業每個單元都能夠以價值創造為導向,實現企業利益最大化。但是,由于這一考核體系設計理念相對理性和剛性,而且指標眾多內容龐雜,在一些試行的商業銀行中引起不少爭議。

      二、 理論與模型

      制度經濟學(Institution Economics)與機制設計理論(Mechanism Design Theory)指出,“好的(Good)”制度與機制取決于兩個最重要的因素:制度設計與制度執行。制度設計主要解決衡量標準和衡量內容等方面的問題,制度執行主要解決制度運行與監督保證方面的問題。由于個人目標函數差異較大,阿羅已經證實,在所有人都是理性選擇的前提下,形成一個可以包容所有人偏好的社會目標函數是不可能的。但是,基于“一致計算”的原則,制度和規則必須得到大多數人的同意才會具有可執行性,制度設計的目的才有可能實現。在管理學的經典著作中,德魯克在《管理實踐》中提出的“目標管理”(Management By Objective,MBO)也指出,只有自上而下、自下而上多次討論博弈,最后制訂的組織目標才會成為激勵手段而不僅僅是考核與約束。

      績效考核或績效評價(Performance Evaluation)是對行為過程(Progress)和行為結果(Results)的考核與評定。顯然,評估標準和評估執行是影響評估結果的兩個最重要的影響因素。在現有的績效考核實踐中,幾乎所有的組織單位都是自上而下的制訂一套考評體系,或者邀請咨詢機構設計一套考評體系來對員工進行績效考核,很少能夠按照“一致同意”的原則通過上下互動溝通而設定考核標準和考核執行機制。研究表明,一些組織高強度的績效考核不僅沒有發揮應有的激勵作用,反而扭曲了員工的工作態度和工作行為。員工的工作滿意度、工作投入度、組織承諾、組織公民行為變得越來越低,而消極怠工、蓄意破壞、不合作、忠誠度下降、離職等行為卻越發普遍,績效考核不再發揮應有的激勵員工的正面作用,反而在某種程度上成為員工“反生產行為”的導火索。因此,員工在對績效考核的認知與感受是至關重要的,員工對于績效考核的公平感會直接影響員工行為(OCB)和組織績效目標的實現。

      員工的公平感是一種主觀感受,而不同員工的主觀感受是有差異的。對于績效考評而言,員工首先考慮的應該是考核目的能不能接受、考核指標設置合不合理、考核內容合不合適、考核結果有沒有及時反饋等等,公平感只是對考核結果與激勵約束匹配差異的一種反應。顯然,這種反應與個體情況緊密相關。對“反生產行為”可能產生影響的人口統計學變量包括年齡、性別、婚姻狀況、受教育程度以及工作年限等。在中國樣本中,收入和職位是另外兩個最可能影響個體認知與行為的因素。在以往的實證研究中,人口統計變量一般都作為控制變量進入計量模型的,盡管這些變量與“反生產行為”關系的研究結論尚未統一,但是在回歸模型中這些控制變量往往又是顯著的。這說明,一套既能防止員工“反生產行為”產生又具有激勵作用的績效考核指標體系設計的關鍵,是能夠在堅持戰略目標導向的前提下,充分考慮員工個體情況的差異,在考核標準制訂和考核執行兩個方面都能做到讓最多數的員工滿意。尤其是在商業銀行這樣的特殊企業類型中,員工績效考核更需要考慮員工的反應和行為。

      三、 實證研究

      1. 問卷設計與發放。在商業銀行中引入管理會計系統作為員工績效考核的指導思想和藍本,固然能夠扭轉國有銀行職工長期養成的地位優越的思想認識,但同時也讓很多員工感覺壓力太大和難以適應。管理會計系統本身比較專業,如果沒有相應的財務知識可能很難理解。此外,一套完整的績效考核體系應該包括考核指導思想、考核目的、考核準備、考核內容、考核指標、考核過程、考核時間、考核反饋和考核效果等幾個方面,員工對績效考核的滿意度主要來自于對這些考核要素的評價和認知。依據上面提出的理論模型和商業銀行績效考核的要素與環節,本文設計了39項問題,請調研對象對考核的指導思想、考核目的、考核準備等問題進行評價,評價尺度為Likert五點量表。最后一題是效標測項,也是員工總體滿意度測項。這樣,問卷主體共有40道問題。其次是人口統計變量,包括性別、年齡、職位、收入等,共9題。其中,工齡包括兩個方面的問題,一是個人全部工作時間,二是個人在本單位的工作時間。經驗是指是否有其它銀行工作經歷,有記為1,無記為0。

      問卷在廣州某著名商業銀行全行發放,發放時間為2013年2月~2013年4月,共發放400份問卷,回收有效問卷316份,有效率為79%。

      2. 描述性統計。首先觀察員工對績效考核各要素的評價是否存在個體差異。如果所有員工對績效考核的指導思想、考核目的、考核準備、考核指標等問題都具有同樣的判斷,那么績效考核就不會在不同部門、不同級別的員工中造成不同的影響。

      方差檢驗表明,從績效考核各要素的角度看,考核是否經過充分準備在人口統計變量中的差異性最多,不同年齡、不同職位、不同學歷、不同專業、不同收入和不同工作經驗的人對銀行績效考核的準備工作評價都有顯著不同;其次是對考核目的的評價,學歷、專業、婚姻、收入和經驗都是顯著的影響因素;再次是對考核能否及時反饋和考核效果的評價,年齡、學歷、收入和經驗同樣是顯著的影響因素。而從人口統計學變量的角度看,對績效考核各要素的評價差異最大的影響因素則是個人年收入、是否有其它銀行工作經驗、學歷和年齡,尤其是收入變量和工作經驗,不同收入和工作經驗的人幾乎對所有績效考核要素的評價都存在差異性。

      其次考察員工對績效考核的總體滿意度在人口統計變量中是否具有顯著性差異。分析結果表明,幾乎所有的人口統計學變量對績效考核的總體滿意度評價都有顯著性差異,換句話說,幾乎所有不同身份特征的員工對現有績效考核工作都有不同的看法和意見。

      3. 計量分析。本文認為,員工對績效考核的認知與評價是影響員工考核滿意度的主要因素,而在這一影響過程中,不同人口統計變量將對主效應產生重要影響。從方差檢驗的結果看,績效考核各要素評價和績效考核總體滿意度在不同身份特征的員工之間存在顯著的差異性。本部分還將利用逐步回歸模型(Stepwise Regression)考察人口統計變量、考核評價對滿意度的影響。統計軟件為SPSS17.0。

      結果表明,在控制變量對總體滿意度的回歸中,員工的職位、年齡、學歷、收入、經驗都是影響員工績效考核總體滿意度高低的因素。但是,職位、年齡、學歷和收入三個變量的影響都是負面的,職位越高、年齡越大、學歷越高、收入越高的員工滿意度越低,僅有工作經驗的影響是正的。而在績效考核各要素對總體滿意度的回歸中,指導思想、考核準備、考核過程、考核反饋和考核效果等幾個方面是影響員工總體滿意度的主要因素。其中,考核過程越復雜,牽涉的方面越多,越容易引起員工的不滿。把人口統計變量作為控制變量進入總回歸模型后,控制變量仍然顯著的是職位、收入和工作經驗,但是工作經驗的符號由正變成負,也就是說,有其它單位工作經驗的人滿意度越低。此外,在本單位工作時間長短也成為影響總體滿意度高低的一個因素,在本單位工作時間越長的人,滿意度越高。和單純的控制變量回歸結果相比,單位工作時間的影響作用也發生了反向變化,由負面影響(但不顯著)變成正面影響。而與單純的績效考核要素對滿意度的回歸結果相比,考核效果評價的影響作用不顯著,但是考核指標評價的影響作用加強,即考核指標設計得越復雜,越容易引起員工的不滿。

      四、 分析與討論

      員工績效考核是一個系統,這一系統不僅包括了考核指標設計、考核標準制訂、考核的具體執行等方面的內容,而且還應該包括考核指導思想、考核目的、考核準備、考核反饋機制等等。為了盡量少引起員工的“反生產行為”,考核的每一個環節都應該得到員工的理解和支持,如果員工不認同或不接受績效考核的設計理念、具體內容和執行方式,那么績效考核的激勵作用就會消失殆盡,員工的抵觸情緒和抵觸行為就有可能不斷發生。

      本文的實證研究結果證實,績效考核各要素評價在員工個體間存在著顯著的差異,而且績效考核的總體滿意度在不同身份的員工之間也存在顯著差異。這說明,在商業銀行的績效考核過程中,存在著員工“反生產行為”產生的可能,本文提出的理論模型是成立的。進一步的考察發現,職位、收入和工作經驗是影響員工總體滿意度的最重要的三個影響因素,而且全部都是負面影響。就職位因素而言,職位越高的人滿意度越低,可能的原因是越高層的員工,手中掌握的權力越大,在成本概念沒有得到加強之前,職位產生的權力租金(Power Rents)基本上由領導本人說了算;但是,管理會計系統強化了利潤創造,對成本結構形成硬性約束,職位帶給領導的各種收益將被降低。而且,績效考核工作量大,指標計算復雜,考核頻率快,持續時間長,給領導增加了工作負擔。因此,領導層對強制性的績效考核往往都有不滿情緒。從收入的角度看,收入越高的人對績效評價的總體滿意度越低,可能的原因是這一指標和職位因素密切相關,銀行職工的收入在領導層和普通員工之間拉得距離較大,高收入群體其實就是占據領導職位的人,收入越高,成本約束越強,對績效考核就會越不滿意。從工作經驗來看,有無外單位工作經驗對滿意度的影響是負面的,有其它銀行工作經驗的越容易導致不滿。這一點和單純作為控制變量回歸的結果正好相反,可能的原因是如果不與其它單位比較,本單位的工作經驗對于復雜的績效考核是有妥善應對功能的;但是與其它單位的情況一比較就會發現,這套管理會計系統可能會降低收入或增加工作量,不滿情緒就會產生。這說明,如果單純從方便管理的角度講,一直在本單位工作的員工更容易接受績效考核;這也同樣說明,不同單位工作經驗可能具有雙刃劍的影響。

      從績效考核各要素情況來看,加入控制變量后仍然顯著的有考核指導思想、考核準備、考核指標和考核反饋等幾項指標。這一結果為“一致同意”或MBO管理提供了有力的證據。如果員工能夠認可績效考核的設計理念和指導思想,比如說績效考核不是為了約束個人,而是為了提升銀行競爭力,并從長遠角度不斷提升個人收益水平等,那么員工就容易對績效考核表示滿意。而考核之前的工作也非常重要,俗話說“磨刀不誤砍柴工”是有道理的,既然成本導向型績效考核本身就會對個人收益或個人行為造成重大影響,如果不在行動之前做好教育、宣傳和鼓動工作,員工一方面可能因為難以理解考核內容和指標而產生抵觸甚至對立情緒,令一方面也可能會因為被排除在參與之外不能表達意見而生怨恨。考核指標設計對員工滿意度的影響是負面的,指標設計的越復雜,員工滿意度越低。這一結果比較容易理解。但在實踐中,很多單位的績效考評體系都是極其復雜的,不是專業人士根本就沒法全部搞懂,員工不信任感由此產生。最后一項對員工滿意度產生顯著影響的因素是考核的反饋機制,考核不能及時反饋,或者考核結果與考核承諾的激勵不能相匹配的話,員工的不滿情緒立刻就會產生。這一結果提醒實踐者,“言必行,行必果”必須得到切實保證,形式主義的績效考核更容易傷害員工的積極性。

      五、 總結與建議

      本文以廣州農村商業銀行為樣本,考察了員工對復雜績效考核系統的評價和態度。本文的研究證實了員工個體差異和對績效考核各要要素的評價是影響員工績效考核總體滿意度的重要影響因素。和員工“反生產行為”的相關研究相比,本文的研究更為具體和深入,程序公平和結果公平應該貫徹到績效考核的每一個環節,如果員工不能認可績效考核的指導思想、考核指標、考核過程、考核反饋機制,績效考核工作沒有做好充分的準備工作,那么員工的“反生產行為”就有可能會發生。

      本研究發現,個體特征對績效考核滿意度的影響往往都是負面的,職位、收入、工作經驗甚至學歷、年齡等因素都會讓員工產生不滿情緒。每個員工都是獨一無二的,在某種意義上講,他們都是既得利益者,績效考核機制明確了個人的責任和義務,界定了權利的邊界和內涵,這一考核過程極有可能會打破原有的利益格局,觸動某些人心中的“奶酪”,繼而會引起相應的情緒反應。因此,一套考核機制不僅需要盡可能地兼顧最大多數人的利益,接受最大多數人的意見,還需要在高層獲得強有力的支持才有可能真正執行。目前,一些商業銀行推行管理會計系統為藍本的績效考核體系,主要的動力就是來自銀行的最高層。銀行領導承擔的壓力最大,他們迫切需要體制、機制創新來提升銀行競爭力。但是,銀行畢竟不是普通的企業,完全市場化的考核機制是否適用,是否會引起員工的“反生產行為”,還需要在實踐中不斷總結,不斷完善,不斷創新。

      參考文獻:

      1. 關新紅.構建合理的商業銀行績效評價體系.中國財經大學學報,2003,(7):17-21.

      2. 關新紅.基于風險的銀行績效評價方法.中央財經大學學報,2004,(5):26-30.

      3. 謝赤,鐘贊.熵權法在銀行經營績效綜合評價中的應用.中國軟科學,2002,(9):108-110.

      4. 周春喜.商業銀行經營績效綜合評價研究.數量經濟與技術經濟研究,2003,(12):98-101.

      5. 袁云峰,張波.商業銀行經營績效綜合評價體系研究.國際金融研究,2004,(12):28-32.

      6. 張中朝,華軍峰,甘茂智.商業銀行績效考核體系構建——一個現實框架.中央財經大學學報,2006,(9):24-29.

      7. 江小華.我國商業銀行績效考核機制現狀及改革策略.上海金融,2008,(10):32-34.

      8. 曹建平,姚舜,黃明喜.平衡計分卡在商業銀行績效考核中的運用.上海金融,2004,(12):51-54.

      9. 趙國杰,趙紅梅.基于平衡記分卡構建商業銀行績效評價體系.現代財經,2004,(5):3-6.

      人口統計學變量分析范文第3篇

      【關鍵詞】彩票;收入彈性;春節效應

      一、引言

      自從1987年第一批福利彩票開始發行,繼而1995年體育彩票也開始發行,彩票行業逐漸發展完善,成為政府籌措公益慈善資金的重要來源。2011年,我國彩票銷售額就達到2215億元,創下歷史新高,共籌集彩票公益金634億元,為我國的公益事業提供了強大的資金助力。彩票行業的另一個重要貢獻在于提供了大量的就業崗位,特別為很多個體經營者帶來了一個不錯的就業選擇。彩票營業稅也成為服務業營業稅較快增長主因。同時,對普通大眾來說彩票也逐漸的進入了他們的消費生活,其中不乏一夜暴富的故事,也有為博頭獎傾家蕩產的反面例子。隨著彩票影響力的不斷增強,國內學界也更多的關注彩票相關的研究。哪些因素影響了彩票銷售就是一個研究的熱點。而在眾多的影響因素中,收入無疑是最關注的焦點。原因是,在中國,彩票公益金的主要用途是政府的福利救濟和中低收入群體的體育健身設施的建設,理想的模式是通過彩票將一部分中高收入人群的收入轉移支付到中低收入人群中,來提高整個社會的福利水平。但是,如果購買彩票的絕大部分都是低收入者,絕大部分的買彩票者都是為了追求一夜暴富,而彩票并沒有想其他娛樂品,例如電影,給購買者休閑的效用,那可能上述理想的情況不但不能出現,有可能還會更糟。如果真的那樣彩票管理者就應該檢查彩票發行機制來改善情形了。

      本文利用中國2007-2010年來省級彩票銷售量的面板數據,從總量分析上來研究人均收入對人均彩票銷售量的彈性,同時,指出總量分析在這種關系識別上存在的問題,通過一個特殊外生事件(春節效應)的研究來對兩者的關系進行修正。

      二、文獻綜述

      在研究收入與彩票銷量關系的文獻中,按數據類型的不同,主要分為微觀分析和總量分析。前者是基于對彩票潛在購買者調查的微觀數據,通過一些例如Tobit一類的微觀計量模型,來研究包括收入、性別、年齡、種族、宗教等個體變量對彩票購買意愿以及購買量的影響。后者是基于地區,國家的宏觀總量統計數據,例如人均收入、人均GDP、教育水平、貧困程度等變量,來研究對該國家或者地區總體彩票銷售量的影響。

      微觀分析代表文獻中,Farrell和Walker(1999)利用基于英國微觀個體的面板數據,通過Tobit模型研究了收入、年齡等一些人口統計學特征對彩票購買者購買概率和購買量的影響,他們主要關注了價格彈性以及“二次反轉”(double rollover)對購買的影響。他們發現高的價格彈性和低的收入彈性。Rubenstein和Scafidi(2002)等通過美國Georgia洲1998年的微觀家庭抽樣調查數據對該州教育彩票的購買偏好和最終用途進行了研究,發現低收入和非白人家庭的購買量更高,但是高收入家庭在教育彩票的收益上更大。同類的研究還有Grotea和Mathesonb(2007)等。

      總量分析的代表性文獻中,Mikesell(1994)研究了1983年倒1991年美國33個州的人均季度彩票銷售量與各州各種經濟指標間的關系,主要發現人均收入對人均彩票銷售量的平均收入彈性達到了3.9,失業率相對與人均彩票銷售量的彈性要低得多,只有0.054。但彩票的銷售量對失業率的變化是敏感的,失業率增加1%彩票銷售量增加0.17%。Mikesell同時指出研究結果也證實了在經濟的衰退期,更多的人會感受更沉重的生活壓力,增加彩票的購買的假設。Garrett(2001)研究了1997年全球82個國家和地區的人均彩票銷售量和該國家地區的主要經濟指標間的關系,發現平均來看全球人均收入對人均彩票銷售量的收入彈性為1.347,比較各個大洲的情況,非洲為0.71,亞洲為1.31,北美為1.182,歐洲為1.681,南美最高為2.065。Garrett還研究了彩票銷售量占國家GDP的比重和各個國家或地區收入水平之間的關系,發現中低收入國家或地區彩票銷售量占國家GDP的比重較高,而低收入和高收入國家的比重較低,近似存在一種倒U型的模式。Coughlin和Garrett(2009)使用2005年美國七個州彩票數據,通過把收入分為名義收入、財富和轉移支付三類,分別考慮了它們對彩票收入的彈性,發現轉移支付的彈性最強,也暗示得到政府轉移支付更多的低收入人群購買了更多的彩票。

      分析文獻我們發現,豐富的微觀數據能夠對潛在彩票購買者的購買意愿和購買數量進行精確的計量分析,而且大多數的結果和微觀經濟學以及心理學的理論相吻合,即對樂透型的彩票,低收入人群,高生活壓力的人群是它的主要購買人群,彩票隨收入增加的邊際消費傾向是遞減的,甚至從理論和現實中都存在低收入者購買彩票的絕對數量也會高于高收入者,比爾蓋茨很難為了中個五百萬而購買一張彩票。但是,對中國國內的研究來說,由于我們還沒有完善的微觀數據收集系統,數據的缺失使這樣的研究很難嚴謹的展開。所以,本文也采用的是總量分析的方法。但特別需要注意的是,總量分析卻存在一個嚴重的問題。僅僅估計到一個正的收入彈性,是無法說明單個個體會隨著收入的增加而增加彩票的消費量。這是因為,針對人均收入對人均彩票銷售量的彈性,總量分析得到的是一個地區一個個體平均意義下收入變化對彩票消費的影響,但是如果該地區本身人均收入的差異很大,高的人均收入的地區伴隨著更多的低收入群體,總量分析的結果就可能有問題。極端的來講,一個高的彈性可能是大量的低收入者巨額的購買和少量的高收入者的零購買形成的,這樣平均意義下的彈性就沒有多少的實際意義。本文后面的工作就是不僅僅估計出人均收入對人均彩票銷售的彈性,還有通過總量數據來分析到底是流動人口是否是彩票的主要消費者。

      三、研究設計與數據來源

      首先,為了得到中國各個省、直轄市彩票的收入彈性,本文在Garrett(2001)的模型上構建了彩票人均銷量與人均收入的計量模型。相對與Garrett(2001)的橫截面模型,本文通過中國2007年至2010年,中國大陸地區31個省、直轄市年度的彩票銷售數據和相應的收入數據建立了面板模型。

      …………(1)

      (1)式中,表示指定省市i年份t的人均彩票銷售量,表示i省市年份t的人均GDP,表示i省市的截距,表示i省市的斜率,表示誤差項。

      本文選擇的面板模型是參數滿足時間一致性的固定效應模型,以為本文使用的數據是橫截面較長,時間維度較短的面板數據,從估計的角度參數容易滿足時間一致性;同時,本文使用的是全國所有省、直轄市的數據,本身就是總體,并且變量都是匯總后的總量數據,使用固定效應模型建模更為自然。

      在變量選擇上,本文用人均GDP來代表收入水平,是因為國家統計局給出的收入指標,分為了農村人口的年度總收入和城鎮人口的年度可支配收入,并沒有一個統一的個人年度可支配收入,考慮到不同省市間城鄉差異較大,參考先前關于彩票收入彈性的研究(如Garrett(2001)),本文選擇了人均GDP來衡量各省市的收入水平。實際上,在研究中我們也嘗試選擇了上述兩個變量來進行分析,估計結果并不改變本文的主要結論。

      第二步,為了分析各個地區實際購買彩票人群的特征是否符合心理學及其相關研究的特征,本文關注了兩個問題,一個是一類特殊的人群,流動人口。眾所周知,我國是一個流動人口的大國,特別是改革開放后,中西部富余勞動力大量的向東部移動,加之我國特有的戶籍管理制度,東部經濟發達地區常年積聚了大量的流動人口。這一部分社會群體是比較符合前面所談到的低收入,高生活壓力的特征,也就是說,他們按照理論分析應該會有更高的彩票購買傾向。存在這樣的可能,在彩票收入彈性更高的地區,很可能是因為有更多的流動人口,他們購買了更多的彩票,才產生了虛假的更高的收入彈性。或者說,高的彈性的一個重要原因之一是以為,在高收入的經濟發達地區聚集了更多的彩票潛在消費者――流動人口。但在,彩票銷售的總量統計數據中,卻并沒有購買者的統計信息,也就無法證明哪一部分彩票是這些流動人員購買的。為了克服這個困難,本文又從時間維度上考慮,在一個特定的時間,大量的流動人口會離開自己的暫居地――春節,具體的說主要是春節到元宵這一個時間段。一年一度的春運高峰,正是這個現象的最好體現。如果前面的邏輯是正確的,那么在流動人口集中度更大的地區,在除夕到元宵所在月份的人均彩票銷量會下降得更多,為了證實這個假設,本文建立了第二個模型:

      …………(2)

      (2)式中,表示各省市春節春節到元宵所在月份與上一月份的人均彩票銷售量的差,表示各省市流動人口占總人口的比例。

      各省市年度的彩票銷售數據來源于中國財政部網站,其余數據都來源于中國國家統計局網站。中國財政部網站上提供了2007年8月至今的省市各月度的以及當年累計的彩票銷售數據,國家統計局網站提供的是各省市年度人口、收入、GDP數據。因為,全國第六次人口普查的詳細數據還沒有公布,各省市流動人口占總人口的比例是通過2005年全國1%人口抽查數據中統計的“全國按現住地分的戶口登記地在外省的人口”數據計算得到。人均彩票銷售量、人均GDP。

      四、實證分析

      首先,需要確定(1)式的具體形式。是相同截距,相同斜率;相同斜率,不同截距;還是不同斜率,不同截距的模型。本文先進行了模型選擇的F檢驗,F(60,62)=1.528,F(30,62)=1.634,所以,最后確定的(1)式的具體形式為,固定效應變截距模型。考慮到省級面板分析時,一般認為存在異方差,所以在估計參數時我們選擇了截面加權的廣義最小二乘。

      (1)式的最后估計結果為:

      R2=0.96,DW=2.15,F=75.57,是每個省市截距對平均截距的偏離。整體的回歸效果比較理想。同時,對模型固定效應進行似然比檢驗,LR=17.14,P

      我們得到的彩票的收入彈性為1.06,同Garrett(2001)研究中得到的亞洲1.31的結果還是比較接近,考慮到Garrett提出的倒U型的收入彈性模式,以及其他大洲的數據,我們預計短期內,收入彈性還有增加的可能,這對整個彩票市場都是一個利好的消息。但是,一個大于1的收入彈性似乎指出,隨著收入的不斷增加,購買彩票的量也會增加得更快,富人比窮人有更強的購買彩票的意愿,這顯然同我們平常的邏輯和心理學的相關研究相悖。正如我們前面分析的,一個平均意義下通過總量分析得到的收入彈性可能會掩蓋社會不同階層對彩票的不同需求。為了分析彩票購買者的人群結構特點,接下來,我們又對(2)式進行了估計。估計時,我們選擇了White異方差修正。

      (2)式的最后估計結果為:

      R2=0.38,DW=1.54,F=17.69。整個模型的R2偏低,原因很大在于流動人口比例數據偏度較大達到了2.07,有不少省市的流動人口占該省人口比例都很小,總體樣本的容量只有31個,一個較低的R2也比較自然。同時考慮到,在95%的置信度下DW值和總體線性的檢驗都通過,(2)式的估計也是可以接受的。

      最后得到流動人口比例的系數為3.69,說明在春節期間,的確有大量的彩票銷量的下降是由于流動人口的暫時離開造成的。也就是說,在平時流動人口是彩票的一個非常重要的消費群體。

      結合上述實證結果,我們可以看到經濟發達地區,人均GDP,人均收入都較高,同時也有較高的人均彩票消費量,但是,這種平均意義下的高的人均彩票消費量掩蓋的是不同人群結構下的彩票消費,改革開放后,我國經濟發達地區吸引了大量的外來人員,積累了大量的流動人口,這些人群往往是相對收入較低,生活壓力較大的群體,他們實際上是這些經濟發達地區彩票消費的主體之一,也暗示真正的高收入群體的人均彩票購買量比總量數據分析得到的平均值要低。進一步,如果要獲得準確的彩票收入彈性或者是收入消費曲線,基于微觀個體的數據就是必不可少的。

      人口統計學變量分析范文第4篇

      變量選擇與數據來源

      農村居民患病就醫的支出費用是一個連續的經濟變量,可以用以下對數線性模型進行估計:(略)其中,Y表示農村居民患病就醫的支出費用;Xi表示影響農村居民患病就醫支出費用的因素;ai表示各個影響因素的影響程度;著表示隨機誤差項,即未被考慮因素的影響,服從標準正態分布。參考美國紐約州立大學Michael.Grossman教授創立的Grossman健康資本需求理論,最終確立個人影響因素和地區影響因素兩大類影響因素,具體情況如表1所示。本文使用2009年CHNS數據進行分析研究。CHNS是北卡羅來納大學人口研究中心和中國疾病控制與預防中心合作開展的“中國健康與營養調查”項目(ChinaHealthandNutritionSurvey,簡稱CHNS)。這個項目是一個包括營養學、公共衛生、經濟學、社會學、中國研究和人口統計學方面的專家團隊,采用多階段隨機分層抽樣方法,在中國的黑龍江、遼寧、山東、河南、江蘇、湖南、湖北、廣西、貴州,共計9個省份,開展的針對城鄉居民的人口、生產、生活、收入、消費、營養健康以及醫療保健等特征的統計調查,是目前中國居民醫療微觀調查中比較權威的數據。

      影響因素定量分析

      1.空模型檢驗

      CHNS數據是在中國的黑龍江、遼寧、山東、河南、江蘇、湖南、湖北、廣西、貴州,共計9個省份開展的調查數據,可能存在層次結構特征,因此對其進行空模型檢驗,結果如表2所示。對數據進行二分類離散數據空模型擬合,得到截距項U0的P<0.01,具有顯著統計學意義,數據確實存在層次結構特征,適用于多層模型進行分析。因此,將其分為兩層,地區層次(高水平)和個人層次(低水平)進行分層模型分析。

      2.多層線性回歸分析

      由于農村居民患病就醫的支出費用是一個連續的經濟變量,因此采用多層線性回歸模型進行分析。通過模型擬合和變量篩選,最終結果如表3所示。可以看到,在個人層次影響因素中,低年齡、高年齡、小學、家庭人均收入和保險對農村居民醫療支出沒有顯著影響,男性、高中、未工作、非農工作和患病嚴重對農村居民醫療支出有顯著正向影響,單身、患病不嚴重和家庭規模對農村居民醫療支出有顯著負向影響。在地區層次影響因素中,農村每千人醫生衛生員數對農村居民醫療支出沒有顯著影響,農村醫療價格水平對農村居民醫療支出有顯著正向影響,農村人均純收入對農村居民醫療支出有顯著負向影響。

      結論

      根據上述定量分析,可以得到以下結論:

      1.個人影響因素

      年齡、家庭人均收入和保險對農村居民醫療支出沒有顯著影響。性別對農村居民醫療支出有顯著正向影響。在農耕活動中,男性勞動產出比女性多,男性比女性更適宜進行體力生產勞作。長此以往,在農耕為主的中國農村家庭中逐漸形成了重男輕女的習俗。男性被視為家庭的支柱,往往具有較高的地位和絕對話語權,這種情況也映射到了農村居民醫療支出上。在農村居民醫療支出中,男性人群的支出水平顯著高于女性人群,男性在醫療服務需求方面處于強勢地位,而女性則處于相對弱勢地位。

      小學教育程度對農村居民醫療支出沒有顯著影響,而高中以上教育程度對農村居民醫療支出有顯著正向影響。受教育程度更高的民眾自我保健養生意識更強,在平時的生活中注重身體健康的保持并善于自我治療保健。當受教育程度更高的民眾確實患病較重或無法自行醫治時,才會選擇就醫治療,且醫療支出水平隨病情嚴重情況也會較高。

      工作和非農工作民眾對農村居民醫療的支出水平高于從事農業工作的民眾,這是由于3方面原因導致的。一是未工作的群眾主要是處于撫育期的婦女和在讀學生,他們得到家庭特別關愛,占有較多家庭醫療資源;二是從事農業工作的民眾患病成本高,一旦生病將會承受疾病帶來的痛苦,損失勞動時間減少勞動所得,更會為恢復健康付出醫療服務費用,因此從事農業工作的民眾較其他家庭成員更為注重自己的身體健康;三是農業工作是一種體力勞動,在一定的勞作程度內能夠起到鍛煉身體增進體質的作用,因此從事農業工作的人群身體素質比較好、健康水平比較高。

      患病嚴重程度與醫療支出水平關系緊密,且關系復雜。從定量分析結果可以看出,患病嚴重的農村居民醫療支出對數比患病一般嚴重的農村居民大1.45,而患病不嚴重的農村居民醫療支出對數比患病一般嚴重的農村居民小0.76,患病嚴重與醫療支出水平呈正相關關系,患病不嚴重與醫療支出水平呈負相關關系。也就是說,當農村居民患有常見疾病,如感冒、發燒等,能自行治療的就盡量自行治療,盡量避免就醫治療。而當農村居民患病較重時,無法自行治療,才會就醫治療。農村居民對于就醫治療的抵觸情緒值得政府深刻研究。

      單身和家庭人口規模都對醫療支出水平有負向影響。結束單身也就意味著家庭成員數量增加,從定量分析結果看,家庭人口規模每增加一人,其相應的醫療支出對數就會減少0.09。家庭成員越多、規模越大,家庭成員之間的相互關懷、相互照顧就會更多,這有利于身體健康水平的保持,在很大程度上具有醫療服務的作用。#p#分頁標題#e#

      2.地區影響因素

      農村每千人醫生衛生員數對醫療支出水平沒有顯著影響。農村醫療價格水平對醫療支出水平有正向影響。農村醫療價格水平的影響可以分成直接影響和間接影響兩個方面。一方面,農村醫療價格水平的提高會直接提高居民的醫療支出水平,看同樣的病,用同樣的藥,卻要比以前付出更多的費用,直接影響了農村居民患病就醫的支出水平;另一方面,農村醫療價格水平的提高將會占據農村居民可支配收入中更大的份額,農村居民不可能在物質生活、精神享受方面追加投資,甚至還會減少投資,這就造成了患病就醫的抵觸情緒,即使患病也盡量不去醫院就診,延誤治療加重病情,從而間接的增加了醫療支出費用。

      人口統計學變量分析范文第5篇

      關鍵詞:登革熱;風險因子;隨機森林;時空擴散;數據挖掘

      中圖分類號:R512.8 文獻標識碼:A 文章編號:0439-8114(2017)07-1250-07

      DOI:10.14088/ki.issn0439-8114.2017.07.013

      Rating System Development of Spatio-temporal Diffusion Risk Factors on Dengue Fever Based on Random Forests

      CHEN Ye-bin1,LI Wei-hong1,HUANG Yu-xing1,LIANG Xue-mei2

      (1.School of Geographical Sciences, South China Normal University, Guangzhou 510631,China;

      2.School of Geographical Sciences, Xinjiang University, Urumqi 830046,China)

      Abstract: Previous researches on dengue fever(DF) mostly adopted the classical quantitative statistical model,but it is hard to consider nonlinear presence of risk factors and to explain their complex interaction relationship. To solve these problems,25 potential risk factors of DF were chosen and screened preliminarily by Pearson correlation method,and potential risk factors that lead to occurrence and diffusion of DF were found out by random forest(RF),and their quantitative evaluation system was also determined. The results showed that data mining ability of RF was better than classical linear model. The risk factors of DF were divided into 4 grades according to its risk to DF from big to small, the first grade included population density,residential distribution,left neighborhood and right neighborhood; the second grade included lower neighborhood and higher neighborhood;the third grade included road,left lower neighborhood, right higher neighborhood, right lower neighborhood,left higher neighborhood,rainfall,O3,PM2.5,PM10,CO,NO2 and pond; the fourth grade included temperature, agricultural land and woodland. In conclusion,RF model could effectively explore and quantify the impacts of various risk factors of DF,and explain the relationship among the various risk factors.

      Key words: dengue fever; risk factors; random forest; spatio-temporal diffusion; data mining

      登革幔Dengue fever,DF)是一種由登革1、2、3和4型病毒引起的危害性極大的急性蚊媒傳染病,主要通過伊蚊進行傳播,廣泛流行于全球熱帶和亞熱帶的100多個國家和地區[1-4]。近年來,登革熱傳播速度及破壞力呈現明顯上升趨勢。據統計,登革熱在全球范圍內年發病數量已高達千萬例,年均死亡人數超過2萬人。

      登革熱的傳播主要受社會人文、周邊鄰域、氣象、環境以及用地類型分布等風險因子的影響[5-15]。研究登革熱疫情的發生、擴散的風險因素是控制疫情的有效方法,也是目前登革熱疫情控制研究的重點和熱點[5]。近年來已有不少學者對登革熱風險因子進行分析與挖掘,探究影響登革熱發生、擴散的影響因素。國外方面,Méndez-Lázaro等[10]、Cheong等[11]、Sheela等[12]采用邏輯回歸方法分析濕地類型、氣候因子與登革熱的風險關系;Hsueh等[13]利用地理加權回歸模型識別人口密度、交通網絡、水體對登革熱的風險影響;?str?im等[14]利用半參數廣義加權模型和邏輯連接函數對登革熱潛在風險因子進行了研究,確定經濟發達地區具備高致災風險性;國內方面,王成崗[9]利用零膨脹Poisson回歸模型挖掘登革熱風險因子,發現溫度、降雨因素對登革熱存在重要影響;李森等[16]通過廣義線性模型探究登革熱風險因子,發現以濕地為主的草場是登革熱病例存在的重要因子;易彬樘等[17]通過調查分析方法研究靜態水體對登革熱的風險影響。

      現有研究在風險因子的探究方面尚未見將社會人文、周邊鄰域、氣象、環境、用地類型等因素進行綜合考慮,探究登革熱與各風險因子之間的依存關系,并對諸多風險因子進行風險等級判別;在模型選擇上主要采用傳統的統計學模型,模型變量過度依賴依存因子的定量精度,無法顧及一些非線性的依存因子以及解釋變量之間所具有的復雜相互作用關系。隨機森林(Random forests,RF)是一種基于統計學習理論的組合分類智能算法[18],它采用Bootstrap重抽樣方法進行樣本選取,構建分類樹,進而對所有分類樹的預測結果進行組合投票得出最終結果。這種方法能夠克服變量之間所存在的多重共線性,確定計算變量的非線性作用。RF具備指標重要性評估方式,能夠通過特征重要性度量,實現重要特征選取,最終確定各風險指標對登革熱的風險貢獻度。正確識別登革熱風險因子,確定風險因子等級排名體系,有助于公眾及政府機關全面認識登革熱流行的風險因素,有利于合理配置防控資源,提高登革熱防控措施的及時性與有效性。

      本研究以廣州市中心區為例,主要采用隨機森林算法剖析社會人文因素、鄰域因素、氣象因素、環境因素以及用地類型分布等潛在風險因子對登革熱的影響,進行影響重要性對比分析,制定風險因子等級排名體系。

      1 數據與方法

      1.1 研究區域

      研究區位于23°1′52″-23°26′6″ N,113°8′42″-113°35′50″ E,包含越秀、荔灣、海珠、天河、白云、黃埔、蘿崗共7個區縣(以下簡稱主城區,圖1),屬亞熱帶季風氣候,年平均日照時間1 370~1 490 h,年平均溫度20~22 ℃,年降雨時間150 d左右,年平均降雨量在1 800 mm以上。研究區總面積1 471.55 km2,包含116個街道,總人口數量超過800萬人。2014年,廣東省暴發了感染登革熱病例的疫情,此次疫情廣州市受災最為嚴重。截至2014年11月,廣州市累計報告登革熱病例達36 934例,其中研究區內累計報告病例31 981例,占全廣州市的86.6%。

      1.2 數據

      1.2.1 登革熱數據 數據采用廣東省疾病預防控制中心提供的2014年廣州市主城區登革熱感染者數據,共計31 981例,時間1-11月。基于格網單元的發病率圖具備信息表達充分的特點,因此本研究采用格網單元對登革熱病例數據進行空間化處理,將登革熱病例數據分配到1 km×1 km的格網單元上,生成登革熱疫情分布情況(圖2)。

      1.2.2 氣象數據 獲取分布于主城區的20個雨量監測站的降雨監測數據(數據來源于廣東省水利廳),站點的空間位置如表1所示;采用反距離加權法(IDW)將站點數據插值為連續的雨量分布數據。

      1.2.3 環境數據 獲取分布于主城區20個環境監測站的2014年環境監測數據(數據來源于廣州市環保局),時間1-12月,時間步長為1個月,每個站點檢測的污染物包括SO2、NO2、PM10、PM2.5、CO、O3共6類,采用IDW插值法對環境監測數據進行插值。研究區環境監測數據插值結果如圖3所示。

      1.2.4 社會人文數據 研究區包含116個街道,總人口數為8 101 691人,人口統計數據如表2所示(數據來源于廣州市2014年統計年鑒)。為了避免傳統人口數據按區域采樣的不足,提高分析結果的準確性,采用面積分配法,將街道人口數據按居民住宅總面積分配到建筑物上,保證人都在居民區上,如式(1)所示。

      Ri=Mi×Li×■ (1)

      式中,i為街道建筑物編號,Ri為第i棟建筑的人口數,Mi為第i棟建筑基底面積,Li為第i棟建筑樓層數,R為街道總人口數,n為街道范圍內建筑數量。

      1.2.5 用地類型數據 2014年Spot 2.5 m衛星遙感影像圖,研究區內2014年基礎地圖矢量稻蕁0賜戀乩用類型將用地分為8類,分別為林地、農用地、草地、公共綠地、河流、池塘、居民地和道路,具體分類見圖4。

      1.3 研究方法

      1.3.1 空間自相關分析 登革熱的傳播模式為人-蚊-人[19],登革病毒以蚊媒為載體,將病毒傳播到易感者體內。當傳播現象發生時,感染者與易感者的活動范圍存在空間重合。這種傳播特征導致登革熱病例存在空間自相關特征,需要對其進行定量分析。

      空間自相關程度以全局Moran’s I(Global Moran Index)表示,公式為:

      I=■ (2)

      式中,n為樣本量,即空間位置的個數;Xi、Xj表示空間位置i和j的觀察值,X 表示觀察值的均值,Wij表示空間權重矩陣。對于Moran’s I,可以用標準化統計量Z檢驗n個區域之間的空間自相關關系,公式為:

      Z(I)=■ (3)

      式中,E(I)表示Moran’s I值的期望值;Var(I)表示Moran’s I值的方差。一般當|Z|>1.96,拒絕零假設,即在95%的概率下,存在著空間自相關。

      1.3.2 隨機森林 隨機森林是一種基于統計學習理論的組合分類智能算法,其基本思想是把多個具備互補作用的弱分類器集合起來組成一個強分類器。通過降低單個分類器錯誤的影響,從而提高模型分類準確率和穩定性。

      隨機森林是具備非線性特點的建模工具,具備高預測準確率,分類結果準確,穩定性強,不易過擬合,對異常值和噪聲具有優容忍度等特點,對解決多變量預測及分類問題具有很好的效果[20]。在模型構建過程中,RF可確定變量重要性特征,決定特征選擇變量。

      1)原理及生成步驟。RF是由樹型分類器集合{h(X,?茲k),k=1,…,n}組合而成的分類器,其中參數?茲k為獨立同分布的隨機向量。在分析過程中,每棵樹對輸入向量X所屬的最受歡迎類進行投票,確定模型的最優分類結果。

      RF生成步驟如圖5所示。從總訓練樣本集中通過Bootstrap抽樣隨機抽取k個子訓練樣本集,建立決策分類子樹模型;隨機從分類樹每個節點的n個指標中選取m個,按照最優分割指標進行分割;重復上一步遍歷K棵分類子樹,確定多個分類結果;投票表決決定最終分類結果。

      2)風險指標重要性計算。RF采用Bagging算法集成訓練集,假設訓練樣本足夠大時,約有36.8%的樣本不會出現在Bootstrap采樣子集中,這部分數據稱為OOB(Out-Of-Bag)數據。OOB數據可對決策子樹模型進行評估,確定決策子樹的錯誤分類率,即OOB誤差。RF模型中的OOB誤差具有無偏性特征,計算比交叉驗證法更為高效。

      風險指標的重要性計算方法主要有以下兩種:

      ①計算每棵樹的原始OOB誤差(EOOB1)以及對風險因子i加入噪聲后的OOB誤差(EOOB2),再將兩者的差對所有決策子樹做平均,采用標準差歸一化,得出風險指標i的重要性。在RF中采用IncMSE進行量度,公式為:

      IncMSE=■■(EOOB2-EOOB1)/EOOB1 (4)

      ②通過分析森林中所有節點的風險指標i在節點分割時的基尼指數減少值D的總和后對所有樹取平均,確定風險指標i的重要程度,在RF中采用IncNodePurity進行量度,公式為:

      IncNodePurityk=■×100% (5)

      式中,m、n、t分別是總指標個數、分類樹棵數和單棵樹的節點數,Dkij是第k個指標在第i棵樹的第j個節點的Gini指數減小值,IncNodePurityk為指標在所有指標中的重要程度。

      本研究選取第二種方法作為登革熱風險因子的重要性評價的評判標準。

      決策子樹與預選變量數量的不同會影響隨機森林的強度及相關性,影響結果精度。因此在風險因子篩選時,需要對比不同決策子樹及預選變量數下的測試結果,從而確定最優決策子樹及預選變量數目。圖6分別顯示了在不同預選變量及決策子樹個數情況下的誤差情況,最終選取預選變量數5和決策子樹數量600作為隨機森林的2個參數。

      2 結果與分析

      2.1 空間自相關分析

      一般認為當P小于0.05,|Z|值大于1.96時,則拒絕零假設,表示在95%的概率水平下,存在空間自相關特征。結果表明,登革熱具有強空間相關性,其全局Moran’s I值為0.649 2,P為0.000(小于0.01),Z為51.994 2。因此在進行風險因子分析時,需充分考慮鄰域因子之間的相互作用性,將鄰居格網的登革熱病例納入分析的范疇。

      2.2 空間相關性分析

      登革熱的傳播與擴散在空間上受到多種因素的綜合影響,如用地類別因素、環境因素、氣象因素、人口密度、鄰域因素等。采用空間相關性分析,可初步得出登革熱傳播擴散的風險因子。

      從表3可以看出,人口因素與登革熱存在強烈的正相關關系,相關系數為0.765;其次是道路、居民地、鄰域因子(共8個),溫度、降雨、NO2、PM10、PM2.5與登革熱有較強的正相關性,農用地、林地、CO、O3與登革熱具有負相關性,而草地、公共綠地、河流、SO2與登革熱的相關關系不明顯。

      2.3 隨機森林

      結果顯示,當預選變量數為5,決策子樹數量為600時,RF模型對登革熱分析結果的均方根誤差(RMSE)僅為0.055 678(數據已做標準化),風險因子對登革熱具備72.25%的解釋能力。相較于傳統的前向逐步回歸模型(解釋能力為66.20%,RMSE為0.061 255),RF模型具有更強的解釋能力,對于登革熱發生與擴散的解釋效果更為優秀。

      RF模型分析得出各個風險指標的重要性程度,以重要性程度1%、5%、10%為節點對指標等級進行劃分,共得出4個風險因子等級。從表4可以看出,人口、居民地分布、右鄰域、左鄰域是影響登革熱傳播的第一級別風險因素;下鄰域、上鄰域是影響登革熱傳播的第二級別風險因素;道路、右上鄰域、左下鄰域、右下鄰域、左上鄰域、降雨、O3、PM10、PM2.5、CO、池塘、NO2櫚諶級別風險因素;溫度、農用地、林地為第四級別風險因素。第一與第二風險等級的總貢獻率達71.49%。其中人口因素貢獻程度最大,重要程度達19.08%,居民地分布次之,重要程度為11.41%。

      3 討論

      本研究基于前人的研究成果,綜合考慮了社會人文因素、周邊鄰域因素,氣象因素、環境因素、以及用地類型等共25個潛在風險因子。將隨機森林模型引入登革熱風險因子評價中,構建登革熱風險因子等級排名體系。

      3.1 隨機森林與風險因子評估

      研究表明,隨機森林具備登革熱指標重要性分析功能,能夠挖掘出登革熱風險因子,確定風險因子等級排名體系。從模型效果上看,隨機森林比傳統的線性回歸模型的數據挖掘能力更強,結果更為準確。

      3.2 社會人文因子對登革熱的影響

      人口因素是登革熱發生與擴散過程中最為重要的風險因子之一,重要性占所有因子比重的19.08%,明顯高于其他因子,這與?str?im等[14]強調的登革熱主要風險因子為社會經濟因子的結論相一致。經濟發達地區,人口密度高,登革熱易感人群越多,病毒的攜帶者與傳播者也容易增多,導致登革熱發病率迅速升高。因此在登革熱防控過程中應該重點監控人口密度高、社會活動頻繁、經濟發達的地區。

      3.3 周邊鄰域因子與盛行風向對登革熱的影響

      地理學第一定律表明,地理空間對象間普遍存在自相似性特征,距離越近的物體,相似程度越高。本研究將格網周邊8個鄰域作為風險因子,共同探究周邊區域對登革熱傳播擴散的影響。研究結果表明,鄰域因子是登革熱發生與傳播的另一個重要風險因子,其中與區域有直接邊界接觸的格網(上、下、左、右4個鄰域)對登革熱的影響程度最高,重要程度分別為9.37%、9.50%、10.86%、11.27%,其次是周邊4個角點的格網(左上、左下、右上、右下4個格網),重要程度分別為2.44%、3.33%、3.33%、2.85%。這表明登革熱的流行與暴發存在著區域效應,登革熱疫情會受到周邊區域的影響,所以在加強對登革熱的防控時,應該隨時監控周邊區域登革熱的傳播擴散態勢。

      另一方面,格網的周邊鄰域對區域的影響不一,對區域登革熱有顯著影響的鄰域為右鄰域、左鄰域、下鄰域、上鄰域、左下鄰域、右上鄰域共6個鄰域,而左上鄰域及右下鄰域對區域的影響則相對較弱,該現象與廣州的夏季盛行風向(東南風)相吻合,在盛行風向上的鄰域對區域的影響程度顯著弱于其他鄰域。此現象表明,風向及風力大小對登革熱疫情的傳播擴散存在著不可忽視的影響。

      3.4 用地因子對登革熱的影響

      登革熱的流行與居民地、交通道路分布存在顯著的正相關性,池塘的分布對登革熱產生具有一定作用,林地與農用地的分布對登革熱的影響不明顯。這與Hsueh等[13]的研究結論一致,居民地、交通、水體對登革熱的發生及擴散具有重要驅動作用。進一步證明登革熱的防控應該重點圍繞經濟發達、人口密度高、交通便捷地區。另一方面池塘作為靜止水源地,容易受到人為污染,為媒介蚊蟲提供理想的孳生環境,因此在登革熱防控過程中,應該注意池塘等靜止水體的清潔衛生,防止蚊蟲孳生。

      3.5 環境因子對登革熱的影響

      環境因子方面,O3與CO對登革熱存在抑制作用,NO2、PM10、PM2.5對登革熱存在激勵作用,總體而言氣候因子對登革熱的影響大小排序為O3>PM2.5=PM10>CO>NO2。登革熱病毒主要由伊蚊作為媒介進行傳播,而O3、CO濃度的升高對伊蚊的繁殖具有一定的抑制作用;另一方面NO2、PM10、PM2.5等污染物的升高,表明城市的環境衛生條件惡化,容易促使流行區發病率的增加。

      3.6 氣象因子對登革熱的影響

      氣象因子方面,降水因素對登革熱的影響高于環境因子。在夏秋季節降水量多時,也是登革熱高發期。因此在降水量高的夏秋兩季,應對登革熱進行重點防護。另一方面,由于囟扔虢滌甑繞象因子對蚊蟲孳生的影響存在滯后性,因此本研究得出溫度因子對登革熱的傳播僅具有較弱的影響效力。

      3.7 登革熱風險因子等級排名體系

      登革熱的風險因子等級排名如下:第一等級(人口>居民地>右鄰域>左鄰域);第二等級(下鄰域>上鄰域);第三等級(道路>右上鄰域=左下鄰域>右下鄰域>左上鄰域>降雨>O3>PM10=PM2.5>CO>池塘=NO2);第四等級(溫度>農用地>林地)。

      登革熱的發生與擴散主要受到人口分布及周圍鄰域的影響,這是登革熱產生及流行的重要風險驅動因子。交通因素作為城市化水平的基本指標之一,在促進所在區域經濟發展的同時,大大加快了人與人之間的活動交流,容易導致登革熱在人口密度高的地區迅速擴散蔓延。環境因子在登革熱產生與傳播過程中起到了較為重要的作用,O3、CO對登革熱存在顯著的抑制作用,而NO2、PM10、PM2.5對登革熱的擴散具有明顯的激勵作用。氣象因子對登革熱的擴散存在一定的影響,其中降雨量的多少對登革熱的影響較為明顯,就小區域范圍而言,降雨量對登革熱的激勵作用顯著高于溫度。在用地類型因素中,池塘的分布與登革熱的產生存在弱相關性,激勵作用略弱,而農用地、林地等的分布則對登革熱的影響不明顯。

      登革熱作為一種通過“人-蚊-人”進行傳播的傳染性疾病,其主要風險因子在于人口密度,周邊鄰域的登革熱發展情況以及交通。在全球化背景下,城市地區人口密度迅速增加,城市居民的日常活動交流日趨頻繁,因此更加需要密切關注登革熱病例的產生,一旦發現登革熱病例,應當盡早將患者進行隔離治療,防止登革熱的進一步擴散傳播。

      3.8 結論

      隨機森林模型可很好地挖掘影響登革熱的各類風險因子,量化各風險因子對登革熱的影響程度,解釋各風險因子間的相互關系;人口密度、周邊鄰域登革熱狀況對登革熱影響最大。登革熱作為一種強傳播性疾病,在人口密集的城市地區,應及時收治感染人員進行隔離治療,防止登革熱的進一步擴展蔓延。研究結果可為疾病控制部門預防登革熱提供參考,控制登革熱爆發。隨機森林模型同樣適用于其他傳染性疾病的時空擴散挖掘研究。

      參考文獻:

      [1] 張海林,張云智,馮 云,等.云南省2005年登革熱監測分析[J].中國熱帶醫學,2006,6(7):1162-1163.

      [2] 樊景春,林華亮,吳海霞,等.廣東省2006-2011年登革熱時空分布特征[J].中國媒介生物學及控制雜志,2013,24(5):389-391.

      [3] IPCC. Climate change 2007:The Physical Science Basis.Contribution of Working Group I to the Fourth Assessment Report of the Intergovernmental Panel on Climate Change[M].Cambridge, UK:Cambridge University Press,2007.

      [4] 毛祥華,張再興.中國登革熱的流行現狀[J].中國病原生物學雜志,2007,2(5):385-388.

      [5] 李衛紅,陳業濱,聞 磊.基于GA-BP神經網絡模型的登革熱時空擴散模擬[J].中國圖像圖形學報,2015,20(7):981-991.

      [6] 封 靜,潘安定.廣州氣溫變化特征及其與城市化進程的關系[J].廣州大學學報(自然科學版),2011,10(6):89-94.

      [7] 何隆華,周明浩,褚宏亮,等.遙感技術在蚊媒傳染病研究中的應用進展[J].中國媒介生物學及控制雜志,2014,25(2):184-188.

      [8] HALSETEAD S B. Dengue haemorrhagic fever-A public health problem and a field for research[J].Bull World Health Organ,1980,58(1):1-22.

      [9] 王成崗.廣東省登革流行特征及氣象因素對廣州市登革的影響研究[D].濟南:山東大學,2014.

      [10] M?NDEZ-L?ZARO P,MULLER-KARGER F E,OTIS D,et al. Assessing climate variability effects on dengue incidence in San Juan,Puerto-Rico[J].International Journal of Environmental Research and Public Health,2014,21:9409-9428.

      [11] CHEONG Y L,BURKART K,LEIT?O P J,et al. Assessing weather effects on dengue disease in Malaysia[J].International Journal of Environmental Research and Public Health,2013, 10:6319-6334.

      [12] SHEELA A M,SARUN S,JUSTUS J,et al. Assessment of changes of vector borne diseases with wetland characteristics using multivariate analysis[J].Environ Geochem Health,2015, 37:391-410.

      [13] HSUEH Y,LEE J,BELTZ L. Spatio-temporal patterns of dengue fever cases in Kaoshiung City,Taiwan,2003-2008[J].Applied Geography,2012,34:587-594.

      [14] ?STR?M C,ROCKL?V J,HALES S,et al. Potential distribution of dengue fever under scenarios of climate change and economic development[J].EcoHealth,2012,9(4):448-454.

      [15] SARFRAZ M S,TRIPATHI N K,TIPDECHO T,et al. Analyzing the spatio-temporal relationship between dengue vector larval density and land-use using factor analysis and spatial ring mapping[J].BMC Public Health,2012,12:853.

      [16] 李 森,陶海燕,秦 雁,等.基于b感與地理信息技術的登革熱環境風險因子標識[J].中華疾病控制雜志,2010,14(9):869-873.

      [17] 易彬樘,張治英.中國登革熱流行及控制概況[J].中國公共衛生,2002,18(9):1128-1130.

      [18] BREIMAN L. Random forests[J].Machine Learning,2001, 45(1):5-32.

      亚洲乱色熟女一区二区三区丝袜| 亚洲一线产品二线产品| 亚洲一区二区三区四区视频 | 亚洲欧美熟妇综合久久久久| 亚洲乱码在线播放| 亚洲va中文字幕无码久久| 日日噜噜噜噜夜夜爽亚洲精品| 亚洲日韩国产精品乱| 亚洲精品中文字幕无码A片老| 欧洲 亚洲 国产图片综合| 亚洲国产成a人v在线观看 | 自拍偷自拍亚洲精品偷一| 亚洲人成未满十八禁网站| 在线观看日本亚洲一区| 亚洲欧洲无码一区二区三区| 亚洲性色AV日韩在线观看| 亚洲日韩国产二区无码| 亚洲爆乳AAA无码专区| 亚洲人成人伊人成综合网无码 | 亚洲人成无码网站| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 亚洲AV无码一区二区三区性色 | 亚洲一区二区三区久久久久| 国产精品久久久亚洲| 亚洲热线99精品视频| 精品国产亚洲一区二区三区| 国产A在亚洲线播放| 亚洲AV永久精品爱情岛论坛| 亚洲AV无码国产精品麻豆天美| 久久亚洲精品国产精品黑人| 亚洲AV第一页国产精品| 久久亚洲私人国产精品vA | 亚洲最大天堂无码精品区| 亚洲日本va一区二区三区| 色综合久久精品亚洲国产| 国产亚洲精品美女2020久久| 亚洲人成国产精品无码| 亚洲中文字幕无码一区 | 国精无码欧精品亚洲一区 | 亚洲αv久久久噜噜噜噜噜| 久久精品国产亚洲av影院|