前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經網絡意義范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞:深度學習;行為識別;神經網絡
1 概述
動作行為識別是計算機視覺領域中的一個研究熱點,已經廣泛應用于智能監控、人機交互、視頻檢索等領域中[1]。動作行為識別技術是通過對視頻或者圖像中人體動作行為做出有意義的判斷。有效表達圖像(視頻)中的實際目標和場景內容是最基本,最核心的問題。因此,對于特征的構建和選擇得到廣泛關注,例如STIP、SIFT、MSER等。但是,能通過無監督方式讓機器自動從樣本中學習到表征樣本的特征,會讓人們更好地利用計算機來實現人的視覺功能。而深度學習作為神經網絡的延伸和發展,是通過逐層構建一個多層網絡來使得機器自動學習到隱含在數據內部的關系,從而讓學習到的特征更加準確性。
文章旨在探討深度學習與機器學習(神經網絡)之間的關系,并且介紹深度學習的由來、概念和原理;同時介紹目前深度學習在計算機視覺中的應用。最后提出深度學習目前發展所面臨的問題,以及對未來的展望。
2 深度學習
2.1 深度學習概述
深度學習源于人工神經網絡的研究,是機器學習的拓展。深度學習是經過組合低層特征來形成更加抽象的屬性類別和特征,從中發現原始數據的特征表征[2]。現在用于動作行為識別的技術是通過“動作表征”+“動作分類器”的框架來進行行為識別的。其中“動作表征”是人們手動設計特征獲取到的,也就是在目前識別框架內存在一個對動作圖像(視頻)的預處理過程。
深度學習和淺層學習相對。目前許多學習算法是淺層網絡學習方法,具有一定的局限性,例如在樣本有限的狀況下,表示復雜函數的能力有限制,且對復雜分類問題的泛化能力也會受到一定約束[3]。而深度學習通過學習深層非線性網絡結構,達到復雜函數逼近,又能在樣本少的情況下學習原始數據的特征。BP算法作為傳統神經網絡的典型算法,雖然訓練多層網絡,但僅含幾層網絡,訓練方法很不理想[3]。因為其輸入和輸出間非線性映射讓網絡誤差函數形成含多個極小點的非線性空間,因而經常收斂到局部最小,且隨著網絡層數的增加,容易過擬合。而深度學習可以獲得分布式表示,通過逐層學習算法來得到原始輸入數據的主要變量。通過深度學習的非監督訓練完成,同時利用生成性訓練避免因函數表達能力過強而出現過擬合情況。
2.2 深度學習原理
傳統機器學習僅含單層非線性變換的淺層網絡結構,而且淺層模型單一。這對于深度網絡來說易造成陷入最優或產生梯度分散等問題。因此,Hinton等人在基于深度置信網(DBNs)的情況下提出非監督貪婪逐層訓練算法,隨后提出了多層次自動編碼器深層結構,這給解決深層網絡結構相關的優化難題帶來了希望。此外Lecun等人提出的卷積神經網絡是第一個多層次結構的學習算法。同時深度學習還出現了許多結構:多層感知機、去噪自動編碼器、稀疏編碼等。
卷積神經網絡是第一個真正采用多層次網絡結構,具有魯棒性的深度學習算法,通過探究數據在空間上的相關性,減少訓練參數的數量。而且卷積神經網絡(CNN)適應性強,善于發現數據的局部特征。它的權重共享結構降低了網絡模型的復雜度,減少了權值的數量,使得卷積神經網絡在模式識別中取得了很好的結果。
自動編碼器的核心關鍵是將原始圖像(視頻)輸入信號進行編碼,使用編碼后的信號來重建原始信號,使得兩者之間的重建誤差最小。通過將原始信號編碼成另一形式,能夠有效地提取信號中的主要信息,能夠簡潔地表達原始圖像(視頻)的特征。
3 深度學習的應用
3.1 語音識別
從2009年開始,微軟研究院語音識別專家通過與Hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,使得語音識別的錯誤率相對減低30%,這徹底改變了語音識別原有的技術框架。在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,并且速度飛快。國內方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。
3.2 視頻中的動作行為識別
準確迅速識別視頻中人的動作行為對于視頻搜索和視頻監控具有劃時代的意義。最近幾年,深度學習技術被應用于視頻動作行為識別中。如Ji等人[4]提出多層網絡的3D卷積神經網絡來學習視頻中的時空特征,并通過卷積來實現對整個視頻特征的學習,從而代替之前的時空興趣點檢測和特征描述提取。在TRECVID數據庫上進行的實驗取得了不錯效果。
4 結束語
文章對深度學習的主要概念進行了全面闡述,包括其由來、原理、研究進展和相應的應用等。在很多領域中,深度學習都表現了潛在的巨大價值,但深度學習作為淺層學習的延伸,仍處于發展階段,還有很多問題值得我們深入探討:
(1)我們需要了解深度學習的樣本復雜度,需要多少訓練樣本才能學習到足夠的深度模型。
(2)在推進深度學習的學習理論和計算理論的同時,我們是否可以建立一個通用的深度學習網絡模型,作為統一的框架來處理語音、圖像和語言。
(3)神經網絡具有前饋性連接和反饋性連接,可是我們研究的深度網絡中還沒有加入反饋連接,這些都給深度學習的研究帶來了嚴峻的挑戰。
參考文獻
[1]王亮,胡衛明,譚鐵牛.人運動的視覺分析綜述[J].計算機學報,2002,25(3):225-237.
[2]余凱,賈磊,陳雨強.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,50(9):1799-1804.
關鍵詞:人臉識別技術;病毒管控;人工智能;神經網絡
互聯網在今天的社會中發揮著舉足輕重的作用。如今社會,隨著許多人工智能技術、網絡技術、云計算等互聯網技術不斷發展,像人臉識別等技術的應用越來越廣泛,在控制病毒傳播途徑等場合發揮了巨大作用,不斷地提高著社會的安全性和便利性,不僅提高了防控中病毒檢測效率,也為病毒的控制提供了可靠的技術方法,能夠及時發現和控制公共場所的安全隱患因素,避免對社會經濟、居民生活造成破壞,。但目前的人臉識別等技術還存在許多缺陷,需要完善和革新,充滿著巨大的潛力和進步空間。
1人臉識別技術研究意義
人臉識別技術是一種生物特征識別技術,最早產生于上世紀60年代,基于生理學、圖像處理、人機交互及認知學等方面的一種識別技術。相比于其他人類特征像指紋識別、聲紋識別、虹膜識別等技術,人臉識別雖然存在人臉識別單一性低,且區分度難度高、易受環境影響等不足。但是人臉識別技術擁有速度快、大范圍群體識別及非接觸、遠距離可識別等優勢,都是其他生物識別識別技術所不具備的,而在傳播性強、感染風險大的病毒傳播過程中,這些顯然是必須要考慮的重要影響因素。通過將人臉識別等人工智能技術引入信息管理系統,綜合集成視頻監控、圖像處理、深度學習和大數據等技術,結合非接觸測溫、定位等技術,助力病情防控,在一定程度上推動病毒病情防控信息化、智能化發展進程。可作為加強公共場所的人員的體溫實時監測、地址信息定位的監控管理,規范公共場所針對病毒傳播的預防行為。
2人臉識別技術
2.1人臉檢測技術
人臉檢測是自動人臉識別系統中的一個關鍵環節。早期的人臉識別研究主要針對具有較強約束條件的人臉圖象(如無背景的圖象),往往假設人臉位置靜止或者容易獲取。人臉檢測分為前深度學習時期,AdaBoost框架時期以及深度學習時期。前深度學習時期,人們將傳統的計算機視覺算法運用于人臉檢測,使用了模板匹配技術,依賴于人工提取特征,然后用這些人工特征訓練一個檢測器;后來技術發展,在2001年Viola和Jones設計了一種人臉檢測算法,它使用簡單的Haar-like特征和級聯的AdaBoost分類器構造檢測器,檢測速度較之前的方法有2個數量級的提高,并且保持了很好的精度,稱這種方法為VJ框架。VJ框架是人臉檢測歷史上第一個最具有里程碑意義的一個成果,奠定了基于AdaBoost目標檢測框架的基礎,使用級聯AdaBoost分類器進行目標檢測的思想是:用多個AdaBoost分類器合作實現對候選框的分類,這些分類器組成一個流水線,對滑動窗口中的候選框圖像進行判定,確定檢測目標是人臉還是非人臉。Adaboost框架技術的精髓在于用簡單的強分類器在初期快速排除掉大量的非人臉窗口,同時保證高的召回率,使得最終能通過所有級強分類器的樣本數數量較少。在深度學習時期,開始將卷積神經網絡應用于人臉檢測領域。研究方向有兩種:一是將適用于多任務的目標檢測網絡應用于人臉檢測中;另一種是研究特定的的人臉檢測網絡。人臉檢測技術具有特殊唯一性和穩定性,在現今社會對于構建居民身份識別系統,病毒傳播防控系統,以及計算機視覺交互模型的構建具有廣泛的應用。人臉檢測技術不僅作為人臉識別的首要步驟,也在許多其他領域發揮巨大影響,如人臉關鍵點提取、人臉追蹤、基于內容的檢索、數字視頻處理、視頻檢測、安防監控、人證比對、社交等領域都有重要的應用價值。數碼相機、手機等移動端上的設備已經大量使用人臉檢測技術實現成像時對人臉的對焦、圖集整理分類等功能,各種虛擬美顏相機也需要人臉檢測技術定位人臉。評價一個人臉檢測算法好壞的指標是檢測率和誤報率,我們定義檢測率為:算法要求在檢測率和誤報率之間盡量平衡,理想的情況是達到高檢測率,低誤報率。
2.2人臉識別技術
目前主要流行的人臉識別技術包括幾何特征識別,模型識別,特征臉識別和基于深度學習/神經網絡的的人臉識別技術等。人臉特征識別主要通過對人臉面部結構特征如眼睛、鼻子等五官幾何特點及其相對位置分布等,生成圖像,并計算各個面部特征之間的歐式距離、分布、大小等關系該方法比較簡單,反應速度快,并且具有魯棒性強等優點,但是在實際環境下使用容易受檢測的環境的變化、人臉部表情變化等影響,精度通常不高,細節處理上不夠完善。模型識別技術主要包括隱馬爾可夫模型、主動表象模型、主動形狀模型等,識別率較高,并且對表情等變化影響較小。特征臉識別來源于主成分描述人臉照片技術(PCA技術),從數學上來講,特征臉就是人臉的圖像集協方差矩陣的特征向量。該技術能有效的顯示人臉信息,效率較高。基于深度學習的人臉識別是獲取人臉圖像特征,并將包含人臉信息的特征進行線性組合等,提取人臉圖像的特征,學習人臉樣本數據的內在規律和表示層次。可以采用如三層前饋BP神經網絡。BP神經網絡是1986年由Rumelhart和McClelland為首的科學家提出的概念,是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,是應用最廣泛的神經網絡模型之一。BP網絡本質上是一種能夠學量的輸入與輸出之間的映射關系的輸入到輸出的映射,從結構上講,BP網絡具有輸入層、隱藏層和輸出層;從本質上講,BP算法就是以網絡誤差平方為目標函數、采用梯度下降法來計算目標函數的最小值。BP神經網路輸入層有n個神經元節點,輸出層具有m個神經元,隱含層具有k個神經元,采用BP學習算法訓練神經網絡。BP算法主要包括兩個階段:向前傳播階段和向后傳播階段。在向前傳播階段,信息從輸入層經過逐級的變換,傳送到輸出層。這個過程也是在網絡完成訓練后正常運行時執行。將Xp作為輸入向量,Yp為期望輸出向量則BP神經網絡向前傳播階段的運算,得到實際輸出表達式為向后傳播階段主要包括兩大步驟:①計算實際輸出Op與對應理想輸出Yp之差;②按極小化誤差方法調整帶權矩陣。之所以將此階段稱為向后傳播階段,是對應于輸入信號的正常傳播而言的,因為該階段都需要收到精度要求進行誤差處理,所以也可以稱之為誤差傳播階段。(1)確定訓練集。由訓練策略選擇樣本圖像作為訓練集。(2)規定各權值Vij,Wjk和閾值Φj,θk參數,并初始化學習率α及精度控制參數ε。(3)從訓練集中取輸入向量X到神經網絡,并確定其目標輸出向量D。(4)利用上式計算出一個中間層輸出H,再用本式計算出網絡的實際輸出Y。(5)將輸出矢量中yk與目標矢量中dk進行比較,計算輸出誤差項,對中間層的隱單元計算出L個誤差項。(6)最后計算出各權值和閾值的調整量。所以,卷積神經網絡算法是通過訓練人臉特征庫的方式進行學習生成,對不同環境下不同表現情況的人臉圖像識別有更高的精確性。
2.3人臉識別軟件實現方式
(1)采集人臉數據集,然后對數據集進行標注,對數據進行預處理變成訓練格式。(2)部署訓練模型,根據訓練算法所需依賴部署電腦環境。(3)訓練過程,下載預訓練模型,將人臉數據集分批次作為輸入開始訓練,最終輸出為訓練好的模型。(4)部署訓練好的模型,捕獲畫面即可對畫面中的人臉進行實時檢測。
3人臉識別在病毒傳播防控中的應用
通過人臉識別技術,可以實現無接觸、高效率的對流動人員進行信息的收集、身份識別、定位地址信息等操作,大大減少了傳染的可能性,切斷了病毒傳播途徑,大大提高了工作效率。通過提前收錄人臉信息,采用深度學習對人臉特征模型的訓練學習,即可獲取人臉識別特征模型,再次驗證時即可實現人臉識別和個人信息快速匹配。AI人工智能幫助人們更好的解放雙手,為人們的生活和工作提供了重要的幫助。本文還提出了在人臉識別的系統基礎上,可以加入定位系統、測溫系統等,依托物聯網技術和云計算大數據,更加優化管控系統的效率。病毒傳播防控中人臉識別系統流程可以概括為圖2。
4結語
本文研究了一種人臉識別技術在病毒傳播管控系統中的應用,并分析設計了人臉識別實時監測及病毒管控系統的流程,大大提高了信息管理的效率,減弱了傳播風險。作為一門新興技術,目前的人臉識別技術還存在著諸多不足之處,像存在環境光的影響、人臉表情變化、妝容變化、佩戴口罩等都會影響到系統識別精度;另外安全問題也引人深思:現今人臉支付方式迅猛發展,錄入的人臉模型信息數據庫存在有一定的安全風險,一旦被不法分子盜取信息后果不堪設想,所以模型數據庫安全、網絡安全,也是系統開發中必須重視的問題。人臉識別為代表的人工智能技術的研究,在病毒傳播管控作出重大貢獻,依托我國領先的計算機網絡技術和5G等技術,加強人工智能技術與5G通信技術的結合,優勢互補,以此來加快大數據、人工智能和物聯網技術發展進程,對我國社會進步,促進城市建設和管理朝著高效、秩序、和諧穩定的方向不斷發展,增強我國的經濟實力有著重大價值和研究意義。
參考文獻
[1]王彥秋,馮英偉.基于大數據的人臉識別方法[J].現代電子技術,2021,44(7):87-90.
[2]李剛,高政.人臉自動識別方法綜述[J].計算機應用研究,2003,20(8):4-9,40.
[3]馬玉琨,徐姚文.ReviewofPresentationAttackDetectioninFaceRecognitionSystem[J].計算機科學與探索,2021,7(15):1195-1206.
[4]余璀璨,李慧斌.基于深度學習的人臉識別方法綜述[J].工程數學學報,2021,38.
[5]王紅星,胡永陽,鄧超.基于LBP和ELM的人臉識別算法研究與實現[J].河南理工大學學報(自然科學版),2005.
[6]鐘陳,王思翔,王文峰.面向疫情防控的人臉識別系統與標準研究[J].信息技術與標準化,2020,6,11-13,1671-539X.
[6]彭駿,吉綱,張艷紅,占濤.精準人臉識別及測溫技術在疫情防控中的應用[J].軟件導刊,2020,10,1672-7800.
P鍵詞關鍵詞:視網膜;PCNN;血管分割;MATLAB;GUIDE
DOIDOI:10.11907/rjdk.161883
中圖分類號:TP319
文獻標識碼:A 文章編號:1672-7800(2016)008-0068-03
0 引言
眼睛是人體接受外界信息最主要的器官,約75%左右的信息來源于視覺信息。因此,眼睛健康與否對人的學習、生活和工作的影響非常大。而眼底則是這個器官的重要組成部分,主要包括視網膜、脈絡膜、黃斑和視盤等。眼底視網膜中的血管是人體內唯一可以非創傷的方式直接觀察到的較深層微血管,其顏色、亮度、位置分布、形狀以及曲率等變化可以直接反映出疾病對血管網絡形態結構的影響,是心腦血管疾病對血管微循環檢查的重要部位。因此,視網膜圖像中血管網絡的檢測與分割對心腦血管疾病的診斷及治療具有重要意義[1]。
由于該方法計算公式復雜,涉及參數較多,且目前主要使用編寫腳本程序的方式進行視網膜眼底圖像中的血管分割,各個參數的調整都要在腳本程序中進行,非常復雜,不便于可視化地觀察實驗結果變化。因此,設計開發一款界面友好、操作簡單的視網膜血管分割系統是非常必要的。
MATLAB是一款由Mathworks公司推出的數學軟件,它在數值分析、矩陣運算、數值擬合以及圖形繪制等方面均有極其強大的功能,已被廣泛應用于數字圖像處理、信號處理和系統仿真等各個領域。同時,MATLAB 軟件具有界面友好、操作簡單的圖形可視化界面設計工具,其集成圖形用戶界面GUIDE(Graphical User Interface Development Environment)包含了窗口菜單、對話框、按鈕和文本等各種控件[2]。用戶通過對控件進行布局,編寫控件的回調函數即可實現GUI 與用戶之間的交互,操作十分方便。
本系統在對視網膜眼底圖像中的血管進行預處理并運用脈沖耦合神經網絡(Pulse Coupled Neural Network,PCNN)迭代原理分割的基礎上,利用MATLAB 的圖形用戶界面開發環境(GUIDE)實現了視網膜血管分割系統。該系統為醫學圖像研究提供了一種有效的視網膜血管分割方法,也為醫學圖像處理提供了一個操作方便的實驗平臺。
1 研究方法
首先是對視網膜眼底圖像中的血管進行預處理,然后利用PCNN方法對視網膜圖像中的血管進行分割。
1.1 視網膜血管圖像預處理
所處理的視網膜圖像為眼底視網膜RGB彩色圖像,通過將RGB 彩色圖像分解成紅、綠、藍三通道單色圖像可以發現,綠色通道的視網膜圖像中血管和背景對比度最高, 而紅、藍色通道的單色圖像中噪聲較多、對比度較低, 因此采用綠色通道的視網膜圖像進行處理。
由于視網膜眼底圖像是由專門的醫學設備采集的,血管周圍區域難免會對后續處理產生干擾,因此需要對視網膜圖像進行有效區域的選取。將RGB圖像進行二值化處理,使其歸一化到[0,1]之間,再依次應用形態學中的開運算、閉運算和腐蝕操作,生成二值掩膜圖像。
由于血管直徑大小不一、背景干擾以及成像時光照不均等因素影響,使得血管與背景的對比度較低。為獲得理想的分割效果,要對眼底圖像進行預處理,以增強血管和背景的對比度。本系統主要采用對比度受限制的自適應直方圖均衡化(CLAHE)[3]與二維高斯匹配濾波[4]方法對視網膜血管進行對比度的增強。
直方圖均衡化(HE)的基本思想是通過圖像的灰度分布直方圖確定一條映射曲線,用來對圖像進行灰度變換,以達到提高圖像對比度的目的。然而HE是對圖像全局進行調整的方法,不能有效提高局部對比度。為了提高圖像的局部對比度,有研究者提出自適應直方圖均衡化(AHE)方法,將圖像分成若干子塊,對子塊進行HE處理。但是AHE 對局部對比度提高過大,將導致圖像失真。為了解決這個問題,必須對局部對比度進行限制,這便是CLAHE方法。CLAHE處理后的圖像既能體現不同位置灰度分布之間的差異,又能使全局灰度較為協調。
二維高斯匹配濾波的原理主要是根據血管曲率較小且寬度漸進改變這一特點,將血管近似分段為等寬度的線段,然后用高斯曲線模擬其橫截面的灰度輪廓。由于血管方向具有任意性,因此需要旋轉高斯曲線來匹配不同方向的血管。每30°旋轉一次,得到從0°~180°的6個匹配濾波器,再分別與經過CLAHE處理后的圖像進行卷積,選擇其中最大的卷積值作為增強圖像的像素值。
最后,將經過CLAHE處理之后的圖像減去經過CLAHE、二維高斯匹配濾波后的圖像,即可得到最終的預處理結果。
1.2 基于PCNN的視網膜血管分割
脈沖耦合神經網絡 (PCNN ,Pulse Coupled Neutral Network)[5]是20世紀90年代形成和發展的與傳統人工神經網絡有著根本不同的新型神經網絡,其模型直接來源于高級哺乳動物的視覺神經系統,具有現實的生物學依據,在圖像處理與分析及計算機視覺領域中有著廣泛應用。它不僅能夠克服微小變化造成的影響,而且能夠較完整地保留圖像的區域信息。因此,使用PCNN進行視網膜血管圖像分割具有一定優勢。
本系統采用PCNN簡化模型對視網膜圖像血管自動分割,該模型不僅保持了原始模型的重要特性,而且減少了部分參數。用迭代公式可以描述為:
式中,Sij是外部刺激,即點(i,j)對應像素的灰度值,Fij是神經元的輸入項,Lij、Uij、Yij、Eij分別是神經元的耦合連接輸入、內部活動項、脈沖輸出和動態閾值。VL為連接輸入域的放大系數,β為神經元之間的連接強度系數,VE和αE分別為動態閾值的放大系數和衰減常數因子,W為連接加權系數矩陣。PCNN應用于眼底圖像處理時,其神經元數目與圖像像素數目一致,各神元與像素一一對應,像素的灰度值作為對應神經元的輸入Sij。當連接加權系數矩陣W所在鄰域內有相似灰度值像素時,若其中某個神經元點火產生脈沖輸出,會引起鄰域內相近灰度值像素對應的神經元點火,產生脈沖序列輸出,這些輸出脈沖序列構成的二值圖像Y即為輸出的分割圖像。
2 系統設計思路及方法
根據上述分割過程,將系統設計成兩大模塊,分別對應于兩個界面,主界面為視網膜圖像預處理模塊,子界面為視網膜血管分割模塊。通過使用MATLAB GUIDE中的控件進行布局和編寫相應的回調函數來實現各模塊功能。
利用MATLAB GUI實現視網膜血管分割系統的過程可以分為GUI 圖形界面布局和GUI 程序實現兩部分[6]。對于界面布局,首先要考慮窗口大小、控件位置以及界面所要實現的功能及各控件需要完成的任務。完成控件的布局之后,接著應對控件屬性進行設置,通過在相應的控件上雙擊鼠標左鍵,打開屬性查看器,設置該控件屬性。最后需要對各個控件進行回調函數的編寫,這是界面設計的關鍵一步,直接影響界面各個功能的實現。
3 系統功能實現
3.1 視網膜圖像預處理模塊
視網膜圖像預處理模塊包括選擇圖片、選擇RGB通道、CLAHE增強處理、二維高斯匹配濾波處理以及最終預處理結果5個子模塊,如圖1所示。
具體操作如下:界面初始化后自動加載一幅默認圖片,也可以由用戶選擇其它圖片;單擊“選擇圖片”按鈕,之后會彈出一個對話框,選擇要載入的圖片,可以看到圖片顯示在界面的左上角,文件名顯示在圖片正下方;然后選擇彩色通道,默認為綠色通道,選擇的通道圖像顯示在右邊區域左上角。如果勾選 “生成掩膜”選項,則后面的運行結果均會顯示出單擊“生成掩膜”之后的圖像,默認狀態為未勾選;接下來需要進行CLAHE處理,以增強圖像對比度。在這里,主要是對adapthisteq函數中的參數進行設置;最后單擊“運行”按鈕,結果顯示在右邊區域的右上角。在進行CLAHE處理之后,需要進行二維高斯匹配濾波處理,主要是對濾波核個數、血管半徑及血管段長度進行設置,以進一步增強血管與背景的對比度;然后單擊“運行”按鈕,結果顯示在右邊區域的左下角;單擊“最終預處理結果”按鈕,結果顯示在右邊區域的右下角。
3.2 視網膜血管分割模塊
視網膜血管圖像分割模塊主要是根據PCNN算法迭代原理,調節PCNN各個參數,對視網膜血管圖像進行分割,如圖2所示。
具體操作如下:單擊主界面中的“PCNN分割”按鈕,即可進入視網膜血管分割模塊的界面;接著選擇所需PCNN模型和核,并設置核的半徑大小。若選擇“原始模型”,則需要設置PCNN的6個參數,若選擇“改進模型”,則只需設置PCNN的4個參數;之后設置迭代次數和beta的值,單擊“運行”按鈕,在彈出的對話框中,選擇一幅迭代圖片,將自動生成分割結果;對于分割后的結果,單擊“保存”按鈕,可以保存圖片;最后單擊“返回”按鈕,可以返回主界面。
4 結語
基于MATLAB 軟件在圖形繪制、數值運算及可視化界面開發等方面的優勢,在對視網膜眼底圖像中的血管預處理并運用PCNN算法迭代原理進行分割的基礎上,通過MATLAB GUI 設計完成了視網膜血管分割系統,可以實現視網膜血管圖像的增強處理,進而利用脈沖耦合神經網絡方法對視網膜血管圖像進行分割。本系統提供了一種有效的視網膜血管分割方法,在醫學圖像研究方面具有一定參考價值。同時,系統具有界面友好、操作簡單等特點,為醫學圖像處理提供了一個操作方便的實驗平臺。
參考文獻:
[1] 姚暢,陳后金,李居朋. 基于過渡區提取的視網膜血管分割方法[J].電子學報,2008,36(5):974-978.
[2] 姚秀芳,崔松菲. 基于MATLAB GUIDE的程序設計[J]. 電腦知識與技術,2009,27(5):7767-7768.
[3] 陳萌夢,熊興良,張琰,等. 1種視網膜眼底圖像增強的新方法[J]. 重慶醫科大學學報,2014,39(8):1087-1090.
[4] 姚暢,陳后金. 一種新的視網膜血管網絡自動分割方法[J].光電子?激光,2009,20(2):274-278.
關鍵詞: 情感分析; 情感傾向性; 詞典擴充; 電力客服工單; 主動服務
中圖分類號: TN915.853?34; V249 文獻標識碼: A 文章編號: 1004?373X(2017)11?0163?04
Dictionary expansion based sentiment tendency analysis of power customer service order
GU Bin, PENG Tao, CHE Wei
(State Grid Jiangsu Electric Power Company, Nanjing 210000, China)
Abstract: In order to improve the customer satisfaction and active service consciousness of the electric power enterprises effectively, the textual characteristic of the power customer service order is combined to construct the sentiment analysis model of the power customer service order. The keywords of the service order are extracted according to TF?IDF thought. The word2vec training is used to get the word vector of each word. The cosine similarity is calculated to expand the high similarity field vocabulary to the sentiment dictionary. The service order sentiment analysis and text classification are performed. The validity of the method is verified with experimental analysis. The results show that, in comparison with the original sentiment dictionary, the method of dictionary expansion and service order sentiment tendency analysis is superior, has higher accuracy, and can provide a certain reference significance for the customer relation management of power enterprise.
Keywords: sentiment analysis; sentiment tendency; dictionary expansion; power customer service order; active service
0 引 言
隨著電力體制改革的逐步深化,配電市場競爭不斷加劇,迫切需要供電企業改變傳統的思維方式和工作模式,進一步樹立市場化服務意識,從客戶需求出發,挖掘客戶的潛在需求和內在價值,從而提升客戶滿意度和運營效益。作為與客戶交流、溝通的重要窗口,電力企業95598客服系統記錄了海量的客戶信息,若能徹底挖掘客服工單中的客戶特征、情感信息并了解客戶的關注焦點,對電力企業和客戶都將具有十分重要的意義[1]。
電力客服工單情感傾向性分析可以有效地發掘客戶情感信息和需求,可根據客戶情感傾向性識別潛在的投訴客戶,可根據反饋信息判別某項業務的實施效果等。針對文本情感傾向性分析,現有的理論研究比較側重于文本特征提取以及采用機器學習方法對文本進行分類,但是基于具體業務特征進行情感詞典擴充的研究還比較少,導致情感傾向性計算往往會存在一定的差異,因此,根據電力行業的特c,進行客戶服務工單情感詞典擴充及情感傾向性的研究非常有必要。
情感分析是指利用文本挖掘、機器學習技術分析挖掘隱藏在文本中的情感信息,并將其分類為積極情感態度和消極情感態度[2]。目前,國內外關于文本情感傾向性分析已經進行了較多的研究工作[3?7],文獻[3]基于情感詞間的點互信息和上下文約束,提出一種兩階段的領域情感詞典構建算法,提升了情感詞情感傾向的識別能力。文獻[4]研究了基于矩陣投影(MP)和歸一化向量(NLV)的文本分類算法,實現對商品評價的情感分析,不僅可以有效識別商品評論情感性傾向,而且提升了識別效率。文獻[5]將詞級別向量和字級別向量作為原始特征,采用卷積神經網絡提取文本特征并進行情感傾向性分析,結果表明字級別向量可取得較高的準確率。文獻[6]提出一種詞圖模型的方法,利用PageRank算法得到情感詞的褒貶權值,并將其作為條件隨機場模型特征預測情感詞傾向,提升了具體語境下預測的準確性,但是針對文本數量較大的情況準確率較低。文獻[7]結合句子結構上下文語義關聯信息,提出一種基于深度神經網絡的跨文本粒度情感分類模型,提升了分類準確率,但該方法只適應于特定領域,泛化能力較低。
鑒于以上研究現狀,本文以電力客戶服務領域文本特征為突破口,構建了電力客服工單情感分析模型,基于工單關鍵詞提取對原始的情感詞典進行擴充,并對工單情感傾向性進行分析,最后,通過算例應用驗證了本文所提方法的有效性。
1 相關工作
1.1 情感分類
情感分類技術的主要目標是基于文本數據識別用戶所表達的情感信息,并將文本數據分為正類和負類。當前,針對情感分類的研究,主要從監督學習、基于規則方法、跨領域情感分析等方面展_研究,與此同時,針對文本特征的提取和特征情感判別是情感分類研究的兩個關鍵問題。
1.2 Word2vec介紹
word2vec是Google在2013年開源的一款將詞表征為實數值向量(word vector)的高效工具,采用的模型有CBOW(Continuous Bag?of?Words,即連續的詞袋模型)和Skip?Gram兩種,word2vec采用的是Distributed Representation的詞向量表示方式,經過對輸入集數據進行訓練,可以實現將文本詞匯轉換為維空間向量,然后基于空間向量相似度來表達文本語義相似度,模型輸出結果可用于自然語言處理領域相關工作,比如文本聚類、詞典擴充、詞性分析等。
word2vec生成詞向量的基本思想來源于NNLM(Neural Network Language Model)模型,其采用一個三層神經網絡構建語言模型,假設某個詞的出現只與前個詞相關,其原理示意圖如圖1所示。
圖1中,最下方的為前個輸入詞,并根據其預測下一個詞每個輸入詞被映射為一個向量,為詞語的詞向量。網絡的第一層(輸入層)為輸入詞語組成的維向量網絡第二層(隱藏層)計算為偏置因子,使用激活函數tanh;網絡第三層(輸出層)包含個節點,每個節點表示下一詞的未歸一化log概率,并使用softmax激活函數將輸出值歸一化,最后使用隨機梯度下降法對模型進行優化。
圖1 NNLM原理模型圖
模型的目標函數為:
需要滿足的約束條件為:
2 電力客服工單情感分析模型
本文以某電力公司客服工單數據為研究對象,在深入理解電力業務及工單文本語義特點的基礎上,建立了一種電力客服工單情感分析模型。首先,在進行文本預處理的基礎上,對文本進行分詞處理并且完成關鍵詞提取;然后,采用word2vec訓練工單數據,并基于關鍵詞進行情感詞典擴充,構建電力客服領域專用情感詞典;最后,進行工單情感傾向性分析。
2.1 工單文本預處理
由于工單文本數據中存在大量價值含量較低甚至沒有價值意義的數據,在進行分詞、情感分析中會對結果產生較大的影響,那么在文本挖掘之前就必須先進行文本預處理,去除大量沒有挖掘意義的工單數據。工單文本預處理工作主要包括:刪除未標注業務類型數據、分句處理、文本去重、短句刪除等。
分句處理:將工單數據處理成以句子為最小單位,以句尾標點符號為標志分割,包括“,”,“。”,“;”,“!”等符號。
文本去重:就是去除工單數據中重復的部分,常用的方法有觀察比較刪除法、編輯距離去重法、Simhash算法去重等。
短句刪除:刪除過短的文本,如“還可以”,“非常好”等,設置文本字符數下限為10個國際字符。
2.2 電力客戶服務領域情感詞典構建
2.2.1 分詞
本文采用python的jieba分詞工具對數據集進行分詞,并完成詞性標注和去除停用詞,由于情感分析通常由名詞、形容詞、副詞和連詞等反映出來,因此刪除詞性為動詞的詞匯。jieba中文分詞工具包包含三種分詞模式:精確模式、全模式和搜索引擎模式,綜合分詞效果及后文的研究,本文選擇精確模式進行分詞,三種模式的分詞效果如表1所示。
另外,在實際的分詞過程中,出現了個別分詞結果與實際的語義不符,原因是字典中缺少相關的專有名詞,或者是這些詞語的詞頻較低,比如“客戶/咨詢/抄/表示/數等/信息”,“客戶/查戶/號”,“變壓器/重/過載”,“查/分/時/電價”等,因此,需要對原有詞典進行更新。python中采用jieba.load_userdict(dict.txt)語句添加自定義詞典,其中dict.txt是保存字典內容的文件,其格式為每一行分三部分:一部分為詞語;另一部分為詞頻;最后為詞性(可省略),用空格隔開。
2.2.2 關鍵詞提取
構建電力客戶服務領域專屬情感詞典,需要盡可能保證領域詞典的多樣性,關鍵詞的提取要求一方面能夠盡量反應出這個特征項所屬的類別,另一方面能夠把自身屬于的類別與其他類別有效地區分開來,依據此原理,本文采用TF?IDF思想進行電力客戶服務領域關鍵詞的提取,關鍵詞選取的權重決定了情感詞典的多樣性,為下文情感詞典的擴充做好基礎,算法原理如下。
將工單文檔和特征項構建成二維矩陣,各條工單的特征向量可表示為:
式中:表示第個工單中第個特征中的詞頻。則與為:
式中:表示語料庫中的文件總數;表示包含詞語的文件總數,防止分母為零的情況,通常對分母做+1的處理。因此,的計算公式為:
實際應用中,依據維度的大小確定相應的權重大小,這樣就形成了代表語料特征的關鍵詞集。
2.2.3 基于word2vec進行情感詞典擴充
隨著經濟技術的發展及客戶文化的差異,不同的客戶通常使用不同的詞匯描述同一個對象特征,且電力行業中存在許多專用詞匯,同樣也表達了一定情感,但這些詞脫離于現有的情感詞典,因此,有必要對現有的情感詞典進行擴充,進而提升工單情感傾向性分析的準確性[8]。選取中國知網情感詞集和大連理工大學林鴻飛教授整理和標注的中文情感詞匯本體庫作為基礎的情感詞典,然后依據權重較大的關鍵詞對原有詞典進行擴充[9]。基于上文電力客戶服務工單中提取的關鍵詞,采用word2vec工具對工單數據集進行訓練,根據CBOW模型或Skip?Gram模型訓練出每個詞的詞向量,并通過計算余弦相似度得到文本語義上的相似度,并將相似度較高的詞語加入到情感詞典中。
依據上文分詞后得到的工單文本數據,采用Linux Version2.6環境對數據進行訓練,操作命令如下:
./word2vec ?train data95598.txt ?output vectors_95598data.bin ?cbow 0 ?size 200 ?winodw 5 ?negative 0 ?hs 1 ?sample le?3 threads 12 ?binary 1
其中,data95598.txt為輸入數據集;vectors_95598data.bin為模型輸出文件;采用Skip?Gram模型進行訓練,詞向量維度設置為200;訓練窗口大小設置為5;-sample表示采樣的閾值,訓練結果采用二進制方式存儲。這樣,得到的模型文件中就包含了每個詞的詞向量。
采用余弦相似度計算關鍵詞的相似詞,即基于生成的詞向量計算兩個維向量的相似度,因為word2vec本身就是基于上下文語義生成的詞向量,因此,余弦值越大,表明兩個詞語的語義越相似。向量與的余弦計算公式如下:
通過distince命令計算輸入詞與其他詞的余弦相似度,經過排序返回相似詞列表,再經過人工篩選,將這些詞加入到原有情感詞典中,實現對原有情感詞典的擴充。
2.3 工單情感傾向性分析
工單情感傾向性分析是基于構建的情感詞典,計算每個客服工單的情感分值,從而判斷工單的情感傾向性。通過上文處理,每一個客服工單都可以被分割成一個個子句片段,表示為每個子句片段由一系列分詞后的詞語構成,提取每個句子的情感詞、否定詞等,表示為依據情感詞典中給定詞的極性值計算每個子句的情感值,分別算每個句子的正向和負向情感分值,計算公式如下:
式中:SenSum表示某個客服工單的情感分值;表示第個子句中第個正向情感詞的極性值;表示第個子句中第個負向情感詞的極性值。
在否定子句中,當為偶數時,否定子句情感為正;當為奇數時,否定子句情感極性為負。對所有的子句情感分值求和并求均值,就得到了整個客服工單的情感值,進而判斷客服工單的情感傾向性,若SenSum為正,表示工單情感為正向;否則,工單情感為負向。
3 實驗分析
3.1 實驗數據準備
本文的實驗環境基于Linux系統,采用python語言進行算法的實現,抽取某電力公司95598客服工單數據作為研究對象,運用jieba包進行中文分詞處理,并采用word2vec訓練數據生成詞向量及擴充情感詞典。由于工單數據是按照業務類型生成的,因此選取業務類型為表揚的工單作為正類,選取業務類型為投訴的作為負類,其中,正類和負類數據比例為21,共得到20 000條數據作為實驗數據集,隨后進行情感傾向性分析,隨機選擇70%的數據作為訓練集,30%的數據作為測試集。
3.2 評價指標
當前針對文本分類效果評估有許多方法,本文選擇準確率(precision)、召回率(recall)和值進行文本情感分類效果的評估,準確率是對分類精確性的度量,召回率是對分類完全性的度量,值越大說明分類效果越好,準確率和召回率是一組互斥指標,值是將二者結合的一個度量指標,值越大,分類效果越好,并將通過本文情感分析模型得到的結果與業務員標注的類型做對比分析。它們的計算公式如下:
3.3 實驗結果及分析
本文基于抽取到的客服工單數據,結合設計的電力客服工單情感分析模型,實現對電力客戶服務領域情感詞典的擴充,并基于構建的電力客服領域專屬詞典進行工單情感傾向性分析,70%的數據用于訓練word2vec并進行情感詞典的擴充,30%的數據用于測試工單情感分類的準確性。測試集共包含工單數6 000條,其中正類工單3 895條,負類工單2 105條。將采用本文情感分析模型得到的結果與原始基礎情感詞典得到的結果進行對比分析,見表2。
由表2可知,采用本文構建的電力客服工單詞典針對正向和負向的情感詞都有較高的準確率、召回率和值,由此可知,本文設計的電力客服工單情感分析模型是合理的,且具有明顯的性能優勢。
4 結 語
本文設計了一種電力客服工單情感分析模型,構建了電力客服領域情感專用詞典并進行工單情感傾向性分析。采用word2vec工具對采集到的數據進行訓練,并用測試集數據對本文提出的模型進行驗證分析,結果表明,本文所提方法具有一定的合理性和可行性,可為電力企業客戶關系管理提供一定的參考意義,促進企業客戶滿意度及運營效益的提升。此外,本文主要研究了基于構建的電力客服專用情感詞典進行客戶情感傾向性分析,但是對于無監督性學習方法情感傾向性分析以及情感強度的分析還有待進一步研究。
參考文獻
[1] 李勝宇,高俊波,許莉莉.面向酒店評論的情感分析模型[J].計算機系統應用,2017,26(1):227?231.
[2] SINGH VK, PIRYANI R, UDDIN A, et al. Sentiment analysis of movie reviews: a new feature?based heuristic for aspect?level sentiment classification [C]// Proceedings of 2013 International Multi?Conference on Automation, Computing, Communication, Control and Compressed Sensing (iMac4s). Kottayam: IEEE, 2013: 712?717.
[3] 郗亞輝.產品評論中領域情感詞典的構建[J].中文信息學報,2016,30(5):136?144.
[4] 鐘將,楊思源,孫啟干.基于文本分類的商品評價情感分析[J].計算機應用,2014,34(8):2317?2321.
[5] 劉龍飛,楊亮,張紹武,等.基于卷積神經網絡的微博情感傾向性分析[J].中文信息學報,2015,29(6):159?165.
[6] 黃挺,姬東鴻.基于圖模型和多分類器的微博情感傾向性分析[J].計算機工程,2015,41(4):171?175.
[7] 劉金碩,張智.一種基于聯合深度神經網絡的食品安全信息情感分類模型[J].計算機科學,2016,43(12):277?280.
關鍵字:筆記鑒別;紋理;Gabor
中圖分類號:G642
文獻標識碼:A
文章編號:1672-5913(2008)02-0122-03
1引言
不同的人根據自身的生理特征和后天的學習情況不同,而練就不同的筆跡,正所謂“字如其人”。筆跡正是一種相對穩定的行為特征,因此筆跡可以用來識別個體身份。目前在公安、社會化考試、銀行等領域得到日益廣泛的應用,其中一個典型應用就是高等教育自學考試考生試卷筆跡真偽鑒定。現在試卷筆跡鑒定工作是通過考試中心文檢人員手工比對,這種傳統的筆跡鑒別方法,容易引入個人因素,影響鑒定效果的真實性。隨著考生人數的增多,這項比對工作相當耗費人力、物力。本文正是基于高自考這樣的背景,來研究基于文本獨立的離線筆跡鑒別。
目前筆跡鑒別研究方向可以分為在線(on-line)和離線(off-line)兩類。進一步細分,離線筆跡鑒別又可分為:文本依存(Text-dependent)和文本獨立(Text-independent)
兩種。文本依存就是提前規定書寫內容,文本獨立則對書寫內容沒有限制。筆跡鑒別的復雜性在于字跡的變化性,其任務就是從所有筆跡樣本中提取那些變化最大的特征,然后根據這些特征對測試筆跡樣本進行真、偽分類。
另一個問題是,目前分類方法主要有支持向量機、多層神經網絡等,由于實際應用中樣本數較少,以上方法都不適用,因此本文主要針對訓練樣本少的實際應用情況討論文本獨立型(Text-independent)書寫人識別。通過用Gabor等紋理分析方法提取文字紋理特征,獲得了較好的識別效果。
2基于Gabor小波的紋理分析
紋理分析在圖像處理、分析和識別中廣泛應用,是從圖像中提取反映紋理特性的特征。每個人都有自己的書寫風格,從整體筆跡圖像看,它們含有不同的紋理特征,如筆跡的排版規律(行間、字間排列等)、單個字符的筆劃搭配關系都可以看成是一種紋理。從已知的筆跡鑒別方法來看,有不少都采用了紋理分析的思想。將筆跡視為圖像紋理,利用紋理分析的方法提取筆跡紋理特征并進行鑒別,是目前研究的熱點。
Gabor函數由Dennis Gabor于20世紀40年代提出的,后來被J.Daugman首先用于表征圖像,并用于視覺方面的研究。隨著計算機的不斷發展,成為了非常流行的圖像處理方法,這得益于Gabor函數特有的屬性及其生物意義。生物學的研究表明Gabor函數可以較準確地描述人腦視覺皮層簡單細胞的感受野。如圖1所示。
圖1視覺皮層簡單細胞的感受野與二維Gabor函數的對比
Gabor函數是一個被復正弦函數調制的高斯函數,它是唯一能夠達到時頻測不準關系下界的函數,能夠最好地兼顧信號在時域和頻域中的分辨能力。其中,一維Gabor函數如式(1):
其中m用來控制函數的中心,s為寬度(Gaussian函數的標準偏差),周期為T,函數波形如圖2所示。
圖2一維Gabor函數波形
二維Gabor函數具有方向選擇性和帶通性,能夠比較精確地提取圖像的局部紋理特征。二維Gabor函數如式(2)所示:
3Gabor變換以及筆跡特征獲取
本文使用Gabor核函數對筆跡紋理圖像進行Gabor變換,提取筆跡特征。給定一幅圖像f(x,y),其Gabor變換定義為:
(4)
根據卷積定理,時域中卷積相當于頻域中乘積,故可借助快速傅立葉變換(FFT)。這是由于快速傅立葉變換算法的計算效率要比基本的離散傅立葉變換高出幾個數量級,由于FFT的高效率,在許多情況下實現卷積最有效的方法是先計算參與卷積的序列的離散傅立葉變換,然后將它們的變換相乘,最后計算這些變換乘積的逆變換。快速傅立葉變換算法有很多種,目前廣為使用的是蝶形算法。對于本文中,進行的是二維傅立葉變換,由于其行列可分性,因此可以先對列進行一維快速傅立葉變換,然后對行進行一維傅立葉變換。特征提取的實現過程入下:
(1) 先根據Gabor核函數的參數,即4個頻率和8個相位,依次求出32個Gabor核函數,并對其依次進行二維快速傅立葉變換,將其結果保存到數組;
(2) 對筆跡紋理圖像塊進行二維快速傅立葉變換,將其結果分別與32個Gabor核函數相乘,并且乘上一個系數;
(3) 對32個相乘結果分別進行二維傅立葉逆變換,這樣對于每一個Gabor核函數將對應得到一個Gabor變換系數,該系數為復數,對于每一個筆跡樣本就對應得到32個變換系數;
(4) 針對每一變換系數,分別求出模值,然后根據模值求出方差和均值,經實驗比較,對于本文文本依存情況,僅選取32維方差要比選取32維均值或者64維方差和均值的混合特征作為筆跡特征,鑒別率要高,效果要好,因此最終特征選用32維變換系數模值的方差。
4分類器的構建
由于人工神經網絡、支持向量機等分類器均需要較多樣本進行訓練,而在實際應用中樣本數較少。根據這一事實,并且結合本文提出的訓練方法,本文從樣本距離角度尋求分類器。從相關文獻中了找了8個與距離相關的分類標準,目的是通過實驗從中找出適合于本文的分類器。這8個分類標準依次為歐氏距離、普通距離、相似度、特征距離、Canberra距離、Dice系數、Jacquard系數、向量間距離,其數學表達式分別如式4~1所示:
歐氏距離:
以上8個式子中, 和 分別為特征向量,i=1,2,3,4,5……
實驗時選取8個人的樣本,其中5個人每人1份,另3個人每人10份樣本,共8個人35份筆跡樣本,測試結果如表1所示,表中A,B,C分別為三個書寫人,每人10份筆跡樣本,實驗步驟為(以A為例,其它類似):
(1) 以A的第一份樣本為參考樣本,經“隨機訓練”為每個分類器獲取閾值;
(2) 以A的第一份樣本為參考樣本,用獲取到的閾值,與A的其它9個樣本進行比對,給出測試正確樣本數,對于每個分類器分別填入對應表格“本人”處;
(3) 以A的第一份樣本為參考樣本,用獲取到的閾值,與B、C的各5個樣本進行比對,給出測試正確樣本數,對于每個分類器分別填入對應表格“不同人”處;
(4) 分別統計每個分類器判別正確的樣本數。
根據表中各分類器的分類結果,并結合運算量,本文最終選定歐氏距離作為分類器。對于兩個樣本,其歐氏距離越小,表明兩個樣本越相似,假設兩個樣本之間的歐氏距離為d,分類閾值為g,那么如果d
5結論
本文研究內容是文本獨立的離線筆跡鑒別,結合課題背景本文給出一種基于紋理的方法。實驗時,先采集30人共計108份筆跡樣本,然后對這些筆跡樣本進行預處理、形成紋理圖,使用32個Gabor核函數,進行Gabor變換,把變換后所得系數的方差作為最后的筆跡特征,共32維。最后使用歐氏距離作為分類器,采用本文提出的閾值獲取辦法進行訓練。我們在自己采集的筆跡庫上實驗,在對28人的56份樣本實驗中,對于與參考樣本出自同一人的筆跡樣本的測試,共28份,對于與參考樣本不同人的筆跡樣本,共140份。
從表2可以看出,針對本文方法,對于與參考樣本出自同一人的筆跡樣本的測試,共28份,其中被正確鑒別的份數為26,正確接受率為92.9% 。對于與參考樣本不同人的筆跡樣本,共140份,正確鑒別的份數為126,正確拒絕率為90.0%。達到了較為理想的效果。
Writer Identification Based on Small Amount of Test Samples and TextureAnalyse
Abstract This paper is presented for identification of examination papers handwriting, A kind of algorithm, which is characterized with less training samples and text-independent, is proposed, and it is used of artificial handwriting identification expert knowledge. Finally, experiments show that the correct acceptances rate is 92.9% and the correct rejections rate is 90.0%.
Keywords:handwriting identification, texture, Gabor filter
參考文獻
[1] 孫廣萍. 身份驗證中的簽名鑒別技術[J]. 黑龍江通信技術,2003,(1):34-35.
[2] 劉宏,李錦濤,崔國勤. 基于SVM和紋理的筆跡鑒別方法[J]. 計算機輔助設計與圖形學學報,2003,15(12):1479-1484.
[3] 許春曄,郭寶蘭. 基于Gabor函數的漢字字體識別[J]. 河北大學學報(自然科學報),2001,21(2):167-170.
[4] 邊肇祺,張學工. 模式識別[M]. 北京:清華大學出版社,2000.
[5] Andrew R Webb著. 王萍,楊培龍,羅穎昕譯. Statistical Pattern Recognition, 2ED[M]. 北京:電子工業出版社,2004.
[6] 陶躍華. 基于向量的相似度計算方案[J]. 云南師范大學學報,2001,21(5):17-19.
[7] 易東,陳慶虎. 基于多分類器組合的筆跡驗證[J]. 計算機應用,2006,26(1):172-173.
[8] 劉成林,戴汝為,劉迎建. 簡化的Winger分布及其在筆跡鑒別中的應用[J]. 計算機學報,1997,20(11):1018-1024.