首頁 > 文章中心 > 正文

      構建超平面的決策樹算法的研討

      前言:本站為你精心整理了構建超平面的決策樹算法的研討范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

      構建超平面的決策樹算法的研討

      摘要:如何在測試節點里構造一個恰當的分割超平面是構造決策樹的關鍵,與單變量決策樹不同,多變量(傾斜)決策樹可以找到與特征軸不垂直的超平面。本文將從幾何學角度說明構造測試節點的過程,提出了一種兩階段決策樹的算法。

      關鍵詞:超平面;兩階段;決策樹

      1兩階段決策樹算法

      1.1兩階段構造超平面構造多變量決策樹的中心問題是,在每個測試節點內對于連續的屬性如何研究分割超平面函數如式(1):w1x1+w2x2+…+wnxn+threshold(閾值)=0,這里的X=(x1,x2…xn,1)是一個圖形向量,它是由一個常數和n個描敘實例的特征組成的。WT=(w1,w2,…,wn,wn+1)是一個X的參數向量,也可以稱為權向量(本文中假設WT是一個單位向量)。為了研究在每個測試決策樹節點內構造超平面的過程,首先調整方程式(2):1w1x1+w2x2+…+wnxn=threshold,權向量WT=(w1,w2…wn)可以看作是用函數2構造的超平面的法線方向,然后我們可以將尋找超平面函數2的過程分為兩個步驟:首先找出標準向量WT,然后再找出參數閾值。使WT中至少有一個參數不等于0,得到的超平面就會向特征軸傾斜;使WT中只有一個參數不為0,例如WT=(0,0,…,wi,…,0),得到的超平面就會與特征軸垂直。顯然,如果在每個超平面的WT中只有一個參數不為0,構造的決策樹將會退化為單變量樹。為了深入研究這個問題,首先我們作了一個定義1。

      定義1設V=(v1,v2…vn)(單位向量)是實例空間P內的一個方向向量,a=(a1,a2…an)是實例空間P內的一點。?坌a,如果a′=∑1?燮i?燮naivi,我們就說a′是a的V成分。

      根據定義1可知,如把V當作標準軸,那么a′就是V軸上的值。

      命題1設H是用函數(2)構造的分割超平面,假設A和H的交點的標準成分是v,那么v=threshold(閾值)。

      證明設a=(a1,a2,…,an)是實例空間內的一點,?坌a∈P,a的標準成分b=∑1?燮i?燮nwiai。設a′=(a,a,…,a)是從a到標準軸的映射點,得到式(3):b=∑1?燮i?燮nwiai=∑1?燮i?燮nwia。

      設t=(t1,t2,…,tn)是A和實例空間P的交點,因為WT是實例空間p內的標準向量,所以t=a′。聯合(3)式,可以得到:b=∑1?燮i?燮nwia=∑1?燮i?燮nwiti=v。根據方程式(2),得到v=threshold(閾值)。

      在權重向量WT內,如果只有一個參數不是0,例如WT=(0,0,…,wi,…,0),那么命題1中法線方向是準確的一個實例空間特征。因此,單變量決策樹滿足命題1。從這個角度來看,我們的框架是單變量決策樹的延伸。此外,一旦發現有法線方向,就可以簡單地解決超平面閾值:計算每個實例的標準成分作為一維空間值,然后根據一些標準(如基尼),尋找作為函數(2)閾值的最佳分割閾值。

      1.2兩階段決策樹算法通過在1.1內的分析,尋找超平面函數的過程可以劃分為兩個階段。基于這個,介紹兩階段決策樹算法,這種算法通過兩個階段為每個測試節點構造超平面,如圖1。除了步驟2和3,此算法和其他決策樹算法沒有什么區別。步驟2(第一階段),候選超平面的標準列表是用某種研究函數構造的。許多著名的方法可直接用在這里尋找法線方向,如主成分分析,合作聯盟等。步驟3(第二階段)分為兩個階段:在第一階段中,每個候選超平面閾值是基于一些純判斷標準(如信息增益率和基尼)。在尋找連續屬性分割點方面,這個階段類似于單變量決策樹算法。在第二階段,此模型根據判斷標準從候選列表中選出最佳分割超平面。

      在圖2中給出了構造兩階段決策樹的控制算法。許多算法只能處理一組特定的數據。為了簡化問題分析的復雜性,步驟1對輸入數據集進行預處理。預處理數據集之后,步驟2構造一個使用算法1的構造決策樹樹(參見圖1)。一旦決策樹被構造,它就會被修剪回來。在修剪階段有兩項措施用以評估每個測試節點:如果它是葉指數,則在測試節點下對一些子樹指標(如錯誤率)和測試節點進行評估。如果是前者且后者滿足一些條件(如后者的錯誤率小于前者),則其根是節點的整個樹,由葉取代。不同的算法,采用不同的修剪指標。Quinlan使用錯誤率評估基于統計界的評估[4],BrEiman等人使用成本復雜性評估基于錯誤率和樹的規模(由葉節點數量來衡量)。但是我們采用EBPC4.5[4]和CCPCART來測試已修剪的構造決策樹的性能和修剪算法的影響。

      2結論

      在本文中,首先從幾何學角度重新解釋了構造測試節點的過程,并在此基礎上,提出了兩階段方法來為決策樹的每個測試節點構造超平面。第一階段尋找基于無監督或監督方法的合適的法線方向。基于一些如基尼和增長比的標準,第二階段找出在法線方向上的超平面的截距。最后提出了兩階段的構造決策樹算法。

      亚洲国产V高清在线观看| 亚洲日韩中文字幕在线播放| 国产成人精品日本亚洲专区61| 亚洲欧好州第一的日产suv| 亚洲二区在线视频| 久久久婷婷五月亚洲97号色 | 亚洲综合无码一区二区痴汉| 亚洲av成人一区二区三区| 亚洲午夜精品一区二区公牛电影院 | 亚洲a级片在线观看| 亚洲中文字幕人成乱码| 亚洲国产激情在线一区| 亚洲综合久久精品无码色欲| 亚洲欧洲日韩极速播放| 亚洲熟妇久久精品| 久久亚洲AV成人无码国产最大| WWW亚洲色大成网络.COM| 亚洲 自拍 另类小说综合图区| 国产精品亚洲一区二区三区| 亚洲第一区在线观看| 亚洲日本一区二区一本一道 | 亚洲欧洲综合在线| 精品丝袜国产自在线拍亚洲| 精品国产日韩久久亚洲| 亚洲风情亚Aⅴ在线发布| 午夜亚洲国产精品福利| 国产精品亚洲美女久久久 | 亚洲色大成网站www永久一区| 亚洲AV永久青草无码精品| 亚洲四虎永久在线播放| 亚洲成a人片在线观看播放| 亚洲午夜一区二区电影院| 亚洲一区二区三区在线观看网站| 亚洲AV无码一区二区三区性色| 无码天堂亚洲国产AV| 国产亚洲精品精品国产亚洲综合| 国产v亚洲v天堂无码网站| 91亚洲导航深夜福利| 亚洲一区欧洲一区| 国产精品亚洲一区二区无码 | 亚洲国产日韩在线人成下载|