前言:本站為你精心整理了主成分分析法多元統計論文范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
主成分分析法,又稱主分量分析法是指相關的經濟變量間通常存在著起主導作用的決定性因素,通過對原始變量的相關矩陣內部結構進行分析,找出幾個不相關的綜合指標來線性表示原來的變量,主成分之間既互不相關,又盡可能多的包含了原指標集合。這種方法首先由Hotelling提出,其主要思想是降維。Stone(1947)對美國1929-1938年間的17項國民經濟統計指標進行主成分分析,發現完全可以用三個經濟指標來概括原來的17項指標,大大簡化了數據分析。M.Scott(1961)對英國157個城鎮的發展水平進行主成分分析,發現原57個測度指標完全可以由5個綜合變量替代,既解決了原指標間的信息重疊問題,又簡化了原指標體系的指標結構,主成分分析由此推廣。邱東(1990)系統闡述了主成分分析法的定義、基本思想、基本步驟和特點,認為主成分分析法可以消除評價指標間的相關影響,并且伴隨數學變換過程生成信息量權數和系統效應權數,保證了客觀性。同時也指出了主城分析法在計算綜合評價值未充分考慮指標的重要程度等不足,主要適用于被評價對象較多的綜合評價。隨后,眾多學者對此提出了改進:孟生旺(1992)針對原始數據的標準化處理和主成分個數的選擇問題,認為標準化不如均值化的無量綱處理方法,提出了非標準化主成分分析法。陳述云等(1995)通過對原始數據作對數—中心化轉換,用原始變量的非線性組合表示主成分,同時重點分析樣本協方差矩陣而非相關系數矩陣,提出了非線性主成分法。朱泰英等(2004)提出了加權主成分分析法,認為可以將主成分分析法的客觀分析和層次分析法的主觀分析有機結合。王璐等(2006)在對主成分分析法的權數、降維等問題的研究上,提出了首先要按主成分分析法對指標體系進行分類,得到各方面的評價值后再進行主成分分析,最終得到綜合評價值的二重主成分分析法。段力誌等(2009)在傳統主成分分析法基礎上,首先對原始指標值進行預處理,再借助軟件,將原始數據轉化為少數幾個主成分的線性組合,并進行加權變換,得到改進的主成分綜合值。白雪梅等(1995)則分析了“均值化”、“標準化”、“極差正規化”三種方法的選擇條件是保證方差損失最小。陳衍泰等(2004)認為主成分分析法具有全面性、可比性和客觀合理性等優點,比較適合對評價對象進行分類,但需要大量數據,函數意義不夠明顯,不能反映客觀發展水平。蘇為華(2012)提出經典的R型主成分本質是單項指標標準化結果的加權算術平均值,比當量平均法復雜。趙利等(2013)通過主成分分析法對宏觀經濟中影響城鎮勞動就業因素分析時,提出主成分為宏觀經濟和技術進步,通過VAR模型對主成分進行分析,得出宏觀成分中對城鎮勞動就業影響最大的是消費、產業結構和城市化水平,而技術進步成分中影響最大的是技術進步的結論。黃利文(2013)針對主成分分析中存在的未考慮負向因子的影響,以及采用線性加權法時確定權重方法不統一,評價結果非唯一等缺陷,提出了逼近理想點的主成分分析法,更好地反映了原始數據信息,并較為客觀地給出了綜合評價結果。林海明等(2013)認為主成分分析因缺乏應用條件的考慮而導致評價結果不具合理性甚至錯誤,通過分析因子分析法因子載荷陣的簡單結構、加權算術平均數的合理性,得出主成分分析的應用條件是:指標是正向、標準化的;主成分載荷陣達到更好的簡單結構時,主成分正向,且主成分與變量顯著相關。
二、因子分析
法因子分析法是指從被評對象的觀察變量的相關度出發,利用降維的思想,把繁雜的變量盡可能歸納為幾個綜合因子進行分析的的一種多變量統計分析方法。其基本思想是:將觀察變量按相關度的高低或聯系的緊密程度進行分類,類別內部變量相關性高,聯系緊密,而類別之間的變量則相關度較低,聯系稀疏,每一類變量則代表一個公共因子。具體步驟為:
三、逼近理想解的排序法
TOPSIS法是指預先確定評價問題的理想點和負理想點,分別測量指標向量與兩者的距離,將距離作為評價值進行排序。由H.wang.C.L和Yoon,K.S.于1981年提出,其基本思想是:在所有備選方案中,設定一個各項指標都達到各方案最優的“正理想解”,再設定一個“負理想解”,通過比較各方案的正、負理想解來判斷方案的優劣,判斷標準是:離正理想解越近,離負理想解越遠則方案最優。其優點在于對評價對象的描述比較精確,可以處理多決策者、多指標、動態的對象;不足是評價較剛性,無法涉及有模糊因素的對象。主要使用于優化系統的評價與決策,應用領域較為廣泛。王應明(1998)通過矢量投影將決策方案投影到理想方案上,提出根據投影值大小進行排序。盧方元(2003)針對傳統的TOPSIS法存在的正負理想解難以確定,權重易主觀化,部分方案無法比較等問題提出了改進的TOPSIS法。余雁(2004)在理想點的基礎上,提出了雙基點法,建立了靠近理想解和遠離負理想解兩個基準的改善了的TOPSIS法。于新峰等(2004)通過引入時間因素,將基于區間值的多指標決策問題的研究從靜態領域拓展到動態領域,補充了固定性和區間性指標的標準化公式,定義了時間權重取區間值的時序條件下多指標決策的正理想方案和負理想方案,解決了指標取值、指標權重和時間權重可以全部為區間值模糊數的多指標決策問題。付巧峰(2008)針對傳統TOPSIS法的缺點,提出了改進的TOPSIS法,簡化了正負理想方案的計算,采用目標規劃優化模型和高等數學的方法計算各評價指標的權重,弱化了主觀因素,使其更具合理性和實用性。王敬敏等(2010)針對傳統TOPSIS法決策矩陣求解復雜的缺點對其進行了改進,簡化了正負理想解的計算,并將熵權法應用到評價中,能夠客觀確定評價指標的權重,同時證明熵權法和改進TOPSIS法在競爭力評價中提高了實用性與可信度。王一任等(2013)認為TOPSIS法存在逆序問題,其評價值只能反映各評價對象內部的相對接近度,并不能反映與理想的最優方案的接近程度,且評價值區分各評價對象優劣的范圍也有限,提出了一種新的改良TOPSIS法,使之不僅具有強保序性,而且比傳統TOPSIS法靈敏。大數據的發展,導致評價對象的數據不斷擴大,數據形式不斷改變,研究對象呈現多樣化特征,如何準確地選擇評價方法并有針對性地開展個性化研究和評價,評價結果的一致性能否保證,值得長期探討。
作者:黃小艷單位:湖北工業大學商貿學院