前言:本站為你精心整理了關(guān)于融合主成分及聚類的糧食主產(chǎn)區(qū)范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:為探索我國糧食主產(chǎn)區(qū)農(nóng)業(yè)經(jīng)濟發(fā)展水平的區(qū)域差異性,采用主成分和聚類相結(jié)合的綜合分析方法,對我國13個糧食主產(chǎn)區(qū)2015年的農(nóng)業(yè)經(jīng)濟發(fā)展水平指標數(shù)據(jù)進行分析。根據(jù)發(fā)展指標評價因子之間存在明顯的相關(guān)性特征,用主成分分析方法獲得各個地區(qū)的主成分得分,由分析所得的評價模型計算出13個糧食主產(chǎn)區(qū)農(nóng)業(yè)經(jīng)濟發(fā)展水平的綜合排名,并經(jīng)系統(tǒng)聚類將其劃分為4個類別,發(fā)現(xiàn)各類別的農(nóng)業(yè)經(jīng)濟發(fā)展水平存在很大的差異。這可為我國糧食主產(chǎn)區(qū)農(nóng)業(yè)經(jīng)濟發(fā)展結(jié)構(gòu)的進一步調(diào)整提供理論支撐。
關(guān)鍵詞:主成分;聚類分析;糧食主產(chǎn)區(qū);農(nóng)業(yè)經(jīng)濟
0引言
我國屬于農(nóng)業(yè)大國,“三農(nóng)”是我國社會主義現(xiàn)代化建設(shè)初期的一項重要工程[1]。從改革開放以來,伴隨著社會生產(chǎn)力水平的顯著提升,我國的農(nóng)村經(jīng)濟得到了顯著的發(fā)展,但是仍然存在一定的問題,例如我國農(nóng)業(yè)發(fā)展整體不協(xié)調(diào),農(nóng)村區(qū)域經(jīng)濟發(fā)展不平衡等。很多學者認為我國農(nóng)業(yè)區(qū)域發(fā)展差異化主要由地區(qū)間自然資源等自然地理因素和區(qū)域間經(jīng)濟發(fā)展過程不同的經(jīng)濟因素引起的,具體表現(xiàn)為:區(qū)域GDP非均衡發(fā)展、區(qū)域城鎮(zhèn)化程度和工業(yè)化進程不一以及區(qū)域資本市場發(fā)育存在差距[2]。上個世紀90年代以來,我國13個糧食主產(chǎn)區(qū)糧食生產(chǎn)對我國糧食安全做出了重大貢獻。2014年13個糧食主產(chǎn)區(qū)的糧食產(chǎn)量占全國的75%以上,庫存量占全國的71%,13個糧食主產(chǎn)區(qū)的農(nóng)業(yè)經(jīng)濟具有同質(zhì)性,但也存在很大的差異性。隨著我國農(nóng)業(yè)經(jīng)濟發(fā)展水平的提高,區(qū)域差距成為一個不可回避的現(xiàn)實問題,如何處理好地區(qū)之間的協(xié)同發(fā)展,如何解決農(nóng)業(yè)現(xiàn)代化發(fā)展存在的問題,是當下研究的熱點[3-5]。因此,為了分析我國糧食主產(chǎn)區(qū)農(nóng)業(yè)經(jīng)濟發(fā)展水平的區(qū)域差異,本文擬基于2016年中國統(tǒng)計年鑒公布的13個糧食主產(chǎn)區(qū)2015年的數(shù)據(jù),選取17個具有代表性的指標構(gòu)成現(xiàn)代農(nóng)業(yè)發(fā)展水平評價指標體系,采用主成分和聚類相結(jié)合的綜合方法,開展糧食主產(chǎn)區(qū)現(xiàn)代農(nóng)業(yè)發(fā)展水平的主成分和聚類分析,進而獲得各地區(qū)農(nóng)業(yè)經(jīng)濟發(fā)展水平的綜合得分排名,從而得到農(nóng)業(yè)經(jīng)濟相似的地區(qū),以相互借鑒先進發(fā)展經(jīng)驗,取長補短,相互促進,加快發(fā)展步伐。
1分析原理與方法
主成分-聚類分析方法的核心思想是將主成分分析和系統(tǒng)聚類分析融合在一起。在實際應(yīng)用中,算法首先進行主成分分析,確定分類閾值;然后,根據(jù)主成分得分對樣本再進行聚類分析,給出各類別的綜合得分排名。
1.1主成分分析主成分分析是一種基于相關(guān)系數(shù)或協(xié)方差矩陣、對高維變量進行空間降維的分析方法,即研究具有一定相關(guān)性的多個指標之間的若干個線性組合,且這幾個線性組合所構(gòu)成的新指標互不相關(guān)、且盡可能多地保留了原有指標的信息。本質(zhì)上,主成分分析借助于一個正交變換,將指標數(shù)據(jù)進行標準化處理,然后再根據(jù)指標之間的相關(guān)性判定分類,確定主成分的個數(shù),最后解釋主成分所包含的意義[6-8]。設(shè)有n個樣本,每個樣本觀測有p個指標,(1,2,...,;1,2...,)ijxi=nj=p為觀測值,所構(gòu)成的矩陣為()ijnpXx×=。主成分分析的流程如下:(1)原始數(shù)據(jù)集的標準化:*(),(1,2,...,;1,2,...,)ijijjjxx=?xsi=nj=p(1)其中:jx是第j個變量的樣本均值,js是樣本的標準差。經(jīng)過標準化處理后的數(shù)據(jù)矩陣為***12,*nX=[x,x,...x]。(2)根據(jù)標準化數(shù)據(jù)矩陣計算協(xié)方差矩陣?Σ:11()(),(,1,2,...,)1nilijljlppxxxxijpn∧=×??=??=?????∑∑(2)(3)計算協(xié)方差矩陣?Σ的m個特征值,及每個特征值對應(yīng)的特征向量,記為12(,,w)jjjmjw=ww???,從而獲得主成分jY的線性表達式:*1,(1,2,)pjkjkkYwxjm==∑?=???(3)(4)計算累積貢獻率,獲得滿足要求的r個主成分。通常,要求選取的主成分的方差累積貢獻率達到85%以上。(5)計算所選擇的r個主成分的得分。將原始數(shù)據(jù)的中心化值代入前r個主成分的表達式中,分別計算出各樣本在r個主成分上得分。
1.2聚類分析即根據(jù)樣本的觀測指標,選擇特定的相似性度量,把相似的樣本聚為一類[9-10]。對于類與類之間的距離,在樣品固有特征的基礎(chǔ)上選用組間聯(lián)接法,能夠較好地刻畫樣品(糧食主產(chǎn)區(qū))之間的區(qū)域差異。系統(tǒng)聚類分析是在樣品距離的基礎(chǔ)上選用組間聯(lián)接法,開始將n個樣品聚成一類,然后每次將具有最小距離的兩個類合并,合并后用組間聯(lián)接法重新計算類與類之間的距離,再并類,這個過程一直持續(xù)到將所有的樣品都并為一類為止。1.3主成分-聚類分析主成分-聚類分析是主成分分析和系統(tǒng)聚類分析融合在一起的一種方法,具體算法[11]如下:(1)確定聚類數(shù)。先用主成分分析,得到r個主成分,在此基礎(chǔ)上,用系統(tǒng)聚類法進行聚類分析。最后設(shè)置閾值,根據(jù)方差分析的思想確定聚類的個數(shù)s。(2)計算各個類別的綜合得分;先計算每個樣本的綜合得分1rF?:11rrkkkFwY?==∑?(4)其中:kY是第k個主成分得分,kw是第k個主成分的系數(shù)。再計算各個類別的綜合得分()()()()12...,sF=F,F(xiàn),F(xiàn),其中(i)F是第i(i=1,2,...,s)類的所有樣本的綜合得分平均值。
2實驗結(jié)果與分析
以我國13個糧食主產(chǎn)區(qū)2015年的數(shù)據(jù)為對象,選取17個具有代表性的指標構(gòu)成現(xiàn)代農(nóng)業(yè)發(fā)展水平評價指標體系,具體包括:第一產(chǎn)業(yè)地區(qū)生產(chǎn)總值比重(%)、人均糧食產(chǎn)量(公頃/人)、城市化率(%)、農(nóng)村居民人均可支配收入(元)、單位面積農(nóng)業(yè)機械總動力(萬千瓦/千公頃)、有效灌溉面積(千公頃)、單位面積投入化肥(噸/公傾)、谷物單位面積產(chǎn)量(公斤/公頃)、農(nóng)用化肥施用量(萬噸)、糧食作物播種面積(千公頃)、糧食產(chǎn)量(萬噸)、農(nóng)林牧漁業(yè)總產(chǎn)值(億元)、水庫數(shù)(座)、公共財政支出農(nóng)林水事務(wù)(億元)、木材產(chǎn)品產(chǎn)量(萬立方米)、大牲畜年底頭數(shù)(萬頭)、水產(chǎn)品產(chǎn)量(萬噸),對這17個指標進行主成分-聚類分析,通過聚類結(jié)果產(chǎn)生的糧食主產(chǎn)區(qū)區(qū)域劃分與我國實際情況的對比分析,一方面驗證算法聚類的有效性,另一方面,為有關(guān)業(yè)務(wù)部門制定合理的農(nóng)業(yè)經(jīng)濟發(fā)展決策提供科學的依據(jù)。
2.1主成分分析結(jié)果鑒于選取的17個指標之間具有明顯的相關(guān)性,首先對我國13個糧食主產(chǎn)區(qū)的數(shù)據(jù)進行主成分分析,如果用主成分分析方法對原有17個變量提取所有特征值(17個),原有變量的所有方差都可被解釋,變量的共同度均為1。若提取6個主成分,得到公因子方差分析表如表1所示,可以看到這17個指標的絕大部分信息都能被這些提取的因子解釋,信息丟失極少,因此可以說因子提取的總體效果較佳。成份得分系數(shù)矩陣及其貢獻率的結(jié)果,如表2所示。從表2中可以看出,前6個主成分的累計貢獻率達到91.1%,說明前6個主成分包含了全部指標91.1%的數(shù)據(jù)信息(未被解釋的只有8.9%),且前6個主成分的方差貢獻率分別為:28.3%、26.0%、15.4%、9.9%、5.4%。因此,可以提取前6個主成分來評價13個糧食主產(chǎn)區(qū)農(nóng)業(yè)經(jīng)濟的發(fā)展水平。通過公式17*1(1,2,3,4,5,6)jkjkkYwxj==∑=?可得第一、第二、第三、第四、第五和第六主成分表達式,將經(jīng)過標準化處理后的原始數(shù)據(jù)代入主成分表達式,可得各個地區(qū)在這6個主成分上的得分,如表3所示。結(jié)合6個主成分各自的方差貢獻率,以各個主成分的方差貢獻率作為權(quán)重進行加權(quán)匯總,得到各個地區(qū)農(nóng)業(yè)經(jīng)濟發(fā)展水平指標的綜合評價模型,即:1123456F=0.283Y+0.260Y+0.154Y+0.099Y+0.061Y+0.054Y(5)各個地區(qū)的綜合得分如表4所示。從表4可以看到,江西和遼寧的綜合得分僅為-1.19、-1.23,它們的綜合得分在13個糧食主產(chǎn)區(qū)中綜合得分較低,說明江西和遼寧的農(nóng)業(yè)經(jīng)濟發(fā)展相對于其它地區(qū)來說整體情況較差,而河南的綜合得分為1.50,高于其它地區(qū)的綜合得分,說明河南的農(nóng)業(yè)經(jīng)濟發(fā)展相對于其它地區(qū)來說整體情況較好。
2.2聚類結(jié)果在完成主成分分析的基礎(chǔ)上,利用系統(tǒng)聚類分析方法對主成分得分表3進行系統(tǒng)聚類,得到如圖1所示的聚類譜系圖。由聚類譜系圖可以很直觀地看出各個地區(qū)的親疏和歸類情況,如果選用某固定距離作為閾值,則由譜系圖可將13個地區(qū)劃分成若干個相似群類。本文在充分考慮各個地區(qū)農(nóng)業(yè)經(jīng)濟狀況和綜合得分的情況下,確定分類閾值為4,相應(yīng)的分類結(jié)果為:第一類包括:河南和黑龍江;第二類包括:山東、江蘇;第三類包括:江西、湖南、湖北、安徽、四川、河北;第四類包括:遼寧、內(nèi)蒙古、吉林。最后計算各個類別的綜合得分,得分越高,表示農(nóng)業(yè)經(jīng)濟的水平越高,并按照得分的多少對分類結(jié)果從大到小排序,具體結(jié)果如表5所示。從表5可知,Ⅰ類地區(qū)(河南、黑龍江)、Ⅱ類地區(qū)(山東、江蘇)的綜合得分系數(shù)為正,Ⅲ類(江西、湖南、湖北、安徽、四川、河北)和Ⅳ類(遼寧、內(nèi)蒙古、吉林)地區(qū)的綜合得分系數(shù)為負,說明Ⅰ類、Ⅱ類地區(qū)的農(nóng)業(yè)經(jīng)濟的發(fā)展水平明顯高于其它兩類。從分析可知,13個糧食主產(chǎn)區(qū)之間的農(nóng)業(yè)經(jīng)濟發(fā)展水平是存在差異的,為了縮小地區(qū)之間的差距,應(yīng)該加大對Ⅲ、Ⅳ類地區(qū)的農(nóng)業(yè)投入,增加農(nóng)業(yè)機械的使用量,引進最新農(nóng)業(yè)科技,調(diào)整農(nóng)業(yè)生產(chǎn)結(jié)構(gòu),提高農(nóng)民生活水平。
3討論
本文針對農(nóng)業(yè)經(jīng)濟發(fā)展指標評價因子之間的相關(guān)性,運用主成分-聚類分析方法,對我國13個糧食主產(chǎn)區(qū)的17個農(nóng)業(yè)經(jīng)濟發(fā)展指標進行綜合分析。根據(jù)標準化后的數(shù)據(jù)計算出各指標的評價權(quán)重,然后根據(jù)特征值選出主成分,最后對各個地區(qū)在主成分上的得分進行系統(tǒng)聚類,根據(jù)各個地區(qū)和類別之間的得分對地區(qū)進行綜合排名,將13個糧食主產(chǎn)區(qū)分為4類,各類包含的地區(qū)數(shù)量不盡相同,可以清晰地對比分析哪幾個地區(qū)的農(nóng)業(yè)經(jīng)濟發(fā)展的相似性以及各個地區(qū)的農(nóng)業(yè)經(jīng)濟發(fā)展的差異狀況。第一類包括河南和黑龍江。河南是我國的糧食生產(chǎn)大省,具備豐富的資源和農(nóng)業(yè)發(fā)展經(jīng)驗,是糧食農(nóng)作物的優(yōu)勢產(chǎn)區(qū),經(jīng)濟發(fā)展水平相對較高;黑龍江擁有連續(xù)廣袤的平原,利于大型機械作業(yè),第一產(chǎn)業(yè)地區(qū)生產(chǎn)總值比重比其它地區(qū)的第一產(chǎn)業(yè)地區(qū)生產(chǎn)總值比重大。這兩個地區(qū)的糧食作物面積大,產(chǎn)量高,化肥施用量高,人均糧食產(chǎn)量高,農(nóng)產(chǎn)品商業(yè)化程度高。第二類包括山東和江蘇。這兩個地區(qū)的農(nóng)業(yè)經(jīng)濟水平相對較高,農(nóng)林牧漁業(yè)總產(chǎn)值和農(nóng)民人均可支配收入相對較高,當?shù)卣沧⒅剞r(nóng)業(yè)發(fā)展,為農(nóng)業(yè)科技研發(fā)水平的不斷提高創(chuàng)造了良好的外部環(huán)境。不過仍要兼顧發(fā)展資源節(jié)約型技術(shù),提高農(nóng)業(yè)信息化和標準化水平,從而進一步提高農(nóng)業(yè)經(jīng)濟發(fā)展水平。第三類包括江西、湖南、湖北、安徽、四川、河北。這幾個地區(qū)的農(nóng)業(yè)科技化水平較高,生產(chǎn)效率較高。但是農(nóng)業(yè)經(jīng)濟發(fā)展水平相對于以上兩類地區(qū)較低,糧食產(chǎn)量較低,這幾個地區(qū)的農(nóng)林牧漁業(yè)總產(chǎn)值有待進一步提升,需加強農(nóng)業(yè)經(jīng)濟建設(shè),增加投入,提高農(nóng)業(yè)機械化水平。第四類包括遼寧、內(nèi)蒙古、吉林,這三個地區(qū)的現(xiàn)代機械水平有較大的提升空間,提高技術(shù)減少要素投入和農(nóng)業(yè)科技水平,降低農(nóng)產(chǎn)品生產(chǎn)成本,增加農(nóng)業(yè)總產(chǎn)值和農(nóng)民收入,進而推動農(nóng)業(yè)經(jīng)濟發(fā)展。我國糧食主產(chǎn)區(qū)的農(nóng)業(yè)經(jīng)濟發(fā)展水平存在很大差異,主產(chǎn)區(qū)的地理區(qū)域分布與我國的實際情況基本一致,因此,增加農(nóng)業(yè)機械的使用量,引進最新農(nóng)業(yè)科技,調(diào)整農(nóng)業(yè)生產(chǎn)結(jié)構(gòu),減少要素投入,增加農(nóng)業(yè)總產(chǎn)值和農(nóng)民收入,許是農(nóng)業(yè)經(jīng)濟發(fā)展水平欠發(fā)達地區(qū)追趕高水平發(fā)展地區(qū)的有效途徑。
參考文獻:
[1]崔玉蕾.農(nóng)業(yè)現(xiàn)代化建設(shè)中的經(jīng)濟管理問題與對策思考[J].農(nóng)業(yè)經(jīng)濟,2016(6):6-8.
[2]董俊迪,夏更壽.農(nóng)村區(qū)域經(jīng)濟發(fā)展不均衡的文化成因及消解策略[J].商業(yè)經(jīng)濟研究,2016(7):151-152.
[3]劉影,肖池偉,李鵬,等.1978-2013年中國糧食主產(chǎn)區(qū)“糧-經(jīng)”關(guān)系分析[J].資源科學,2015,37(10):1891-1901.
[4]楊鑫,穆月英.我國農(nóng)業(yè)區(qū)域發(fā)展差異分析及政策選擇[J].經(jīng)濟問題探索,2017(2):168-176.
[5]潘世磊.糧食主產(chǎn)區(qū)農(nóng)業(yè)現(xiàn)代化發(fā)展研究[D].重慶工商大學,2016.
[6]趙薔.主成分分析方法綜述[J].軟件工程,2016,19(6):1-3.
[7]SharpeaJ,FiellerbN.Uncertaintyinfunctionalprincipalcomponentanalysis[J].JournalofAppliedStatistics,2016,43(12):1-15.
[8]LiL,LiuS,PengY,etal.Overviewofprincipalcomponentanalysisalgorithm[J].Optik-InternationalJournalforLightandElectronOptics,2016,127(9):3935-3944.
[9]XuR,WunschD.Surveyofclusteringalgorithms[J].IEEETransactionsonNeuralNetworks,2005,16(3):645-678.
[10]金建國.聚類方法綜述[J].計算機科學,2014,41(S2):288-293.
[11]辛華輝,盛祿,鄧曦,等.主成分—聚類分析方法在城市交通發(fā)展指標評價中的應(yīng)用[J].價值工程,2016(24):76-79.
作者:吳麗萍,林甲祥 單位:福建農(nóng)林大學計算機與信息學院