前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計算機視覺技術原理范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
1、引言
隨著經濟的迅猛發展,汽車的迅速普及,根據社會對汽車產業的要求,車輛的各方面指標都受到人們越來越多地關注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質量,因此如何在生產過程中利用計算機視覺檢測技術檢測出并及時修補汽車涂裝過程中產生的瑕疵就成了首要的任務[1]。本文的研究內容是首先了解計算機視覺檢測系統的工作原理,汽車涂裝瑕疵的種類,然后結合兩者的特點,應用計算機視覺檢測系統檢測汽車涂裝瑕疵。該研究的價值在于兩方面:①對于汽車生產的自動化和過程自動化,計算機視覺是現實真正意義的自動的基礎和一種重要的質量控制的手段;②對于汽車涂裝瑕疵的修補可以提高其修補的精度。
2、汽車涂裝瑕疵的計算機視覺檢測系統
汽車涂裝瑕疵檢測系統主要包括照明系統、圖像采集卡、CCD攝像機、計算機以及軟件處理等幾個主要部分[2]。綜合計算機視覺檢測系統的構成和線結構光測量的原理,基于計算機視覺的汽車涂裝瑕疵的檢測系統大致是這樣構成的:將線結構光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機采集光斑圖像,采集到的圖像信號被傳輸到計算機,根據圖像處理和計算機視覺檢測系統的處理產生處理結果,返回到涂裝生產線,對車身的涂裝進行修正,從而提高產品質量。汽車涂裝瑕疵的視覺檢測系統如圖1所示[3]。
3、計算機視覺檢測
計算機視覺是計算機對圖像進行自動處理并報告“圖像中有什么”的過程,也就是說它識別圖像中的內容。圖像中的內容往往是某些機器零件,而處理的目標不僅要能對機器零件定位,還要能對其進行檢驗。計算機視覺系統基本原理:機器視覺系統通常采用CCD相機攝取圖像,將其轉化為數字信號,再采用先進的計算機硬件與軟件技術對圖像數字信號進行處理,從而得到所需要的各種目標圖像特征值,并在此基礎上實現模式識別、坐標計算、灰度分布圖等多種功能。計算機視覺系統能夠根據其檢測結果快速地顯示圖像、輸出數據、指令,執行機構可以配合其完成指令的實施。計算機視覺系統主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數據類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進行零件檢測的AVI系統,具有一定的代表性。一個典型的AVI系統如圖2所示。
4、汽車涂裝瑕疵的檢測算法
由于汽車涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統的微分邊緣檢測算法無法有效的檢測出來。所以對缺陷模糊邊緣的檢測成為了算法的關鍵[6]。本文介紹了基于線結構光的邊緣檢測方法。汽車涂裝表面被光源投射器發出的線結構光照射,反射出的圖像被CCD攝像機所接收傳輸到計算機視覺檢測系統中。若涂裝表面沒有瑕疵,則產生圖3的圖像。若涂裝表面有瑕疵,則產生圖4的圖像[7]。
關鍵詞:OpenCV;計算機視覺技術;三維模擬技術
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2015)30-0137-02
21世紀是國際計算機技術高度發展的時代,人們生活中的每個角落都可以看到計算機技術的身影,尤其是現代計算機視覺技術和圖像處理功能發展更加迅猛,各技術分支也逐漸趨于成熟。計算機視覺技術主要指的就是利用智能計算機系統來代替人類的眼睛對現實三維世界進行辨識和理解,整個過程均是計算機自我學習的過程,而隨著這項技術研究的不斷深入,其不再僅僅包含計算機技術科學,同時還涉獵了包括生理學、神經學、物理學、應用數學等多門學科,為人類科技的進步提供了有效的動力。
1 計算機對視頻中運動物體檢測的原理概述
在現代計算機技術基礎下,對視頻當中的運動物體檢測原理主要包括兩種,分別是從微觀和宏觀的角度出發。其中宏觀檢測技術指的是當計算機截取了視頻中的某一個圖像,其以整幅圖像為對象進行檢測;微觀檢測技術是指在截取圖像后,根據實際需求對某一區域內的圖像內容進行檢測。在計算機視覺技術實際應用時,其第一步就是對圖像的采集,第二步是對已經采集的圖像進行預分析處理,如果采用宏觀檢測技術則對圖像整體進行分析;如果采用微觀檢測技術則首先將圖像進行分割,然后對分割后各圖像內容中出現的運動物體影像進行分析。在圖像數據獲取過程中應用的是背景差分法,這一技術主要是將背景和運動物體進行分離提取,以獲取沒有背景圖像的運動物體影像數據。還可以利用幀間差分法,這種方法主要是對一個視頻圖像的逐幀畫面進行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結合起來就是一個物體在計算機視覺下的運動軌跡。現代研究者更傾向于將背景和幀間差分法進行結合運用,這樣可以獲得無背景下的運動物體軌跡,進而提升計算機視覺系統捕捉數據的準確性。
2 OpenCV的應用概述
OpenCV是現代計算機視覺技術當中具有開源性的視覺庫,其最早是由俄羅斯Intel分公司所研發,不僅高效,而且具有兼容的優勢。同時與傳統IPL圖像處理系統相比,OpenCV所處理的圖像數據等級更高,例如在對運動物體進行特征跟蹤、目標分割、運動軌跡分析以及三維模型重建等方面都有著巨大的優勢。
OpenCV本身編輯的源代碼是開放式的,編寫過程簡潔且方便,并且程序中大多數函數已經通過了匯編的最優化,使其能夠更加高效地被應用。在使用OpenCV的攝像機標定模塊已經為用戶設計了實用性較強的接口,并且能夠支持Windows界面的操作平臺,使得這一技術的操作更加簡便。這一技術本身操作簡便,對于編程人員和檢驗人員個人技能素質要求并不高,視覺技術系統研發人員可以利用簡便的操作來檢驗其設想是否能夠實現,這就使得現代計算機視覺技術開發團隊能夠形成更好的協作研發關系,進一步提升技術研究效率。目前已知OpenCV編程系統在航空航天定位、衛星地圖繪制、工廠大規模生產視覺檢測等方面得到了廣泛的應用,同時對于無人飛行器的視覺捕捉技術也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強,編程人員可以根據自己的意愿對源代碼進行披露,并且國內也已經形成了規模較大的交流社區,給更多同行業者提供答疑解惑的場所,進一步擴大了OpenCV的應用范圍。
3 基于OpenCV的計算機視覺技術
3.1 基于OpenCV下的運動物體檢測技術
在常規運動物體檢測技術下,均是直接通過圖像背景和運動物體的區分來實現運動物體的捕捉。而基于OpenCV下的運動物體檢測技術則不僅能夠針對于圖像背景的分離實現運動物體的觀察,還可通過物體本身特定的信息來進行檢測,主要包括形狀、輪廓以及顏色等。這樣就能夠實現在復雜的背景當中將特定的運動物體完整抽離出來。其基本流程包括:首先,對影像數據當中某一時間點的圖像進行捕捉,然后對這一視頻圖像的格式進行轉化;其次,對轉化格式后的視頻圖像進行早期處理,并將運動物體和復雜的背景區分開,降低周圍各環境因素對運動物體主體圖像的影響;第三,根據完成提取后的運動物體圖像進行辨識,然后再從視頻當中捕捉擁有相同特征的物體,并對該物體進行跟蹤識別。而這一過程的實質則在于先利用圖像捕捉技術對畫面進行截取,然后同時利用背景差分法和幀間差分法對圖像進行分割,逐幀地將運動物體完成提取出來,以供計算機進行視覺跟蹤處理。
3.2 基于OpenCV的圖像預處理技術
一般情況下,計算機視覺處理技術應用的環境情況較為復雜,大多數應用環境當中均有光照的變化,并且部分計算機視覺處理設備還需要在露天環境下進行工作,此時周圍環境中的風、溫度、光照、氣候以及運動物體數量等對視頻圖像的采集均有著極大的影響。環境因素會使圖像采集的質量大幅度降低,同時圖像當中的噪點問題也難以避免,而噪點是視覺捕捉和圖像處理當中最大的影響因素。因此,在基于OpenCV下的計算機視覺技術在捕捉視頻圖像之后先對其進行預處理,然后再由系統對運動物體進行分離、檢測和跟蹤。一般的預處理過程主要包括平滑度濾波、圖像填充、背景實時更新等。
1)圖像的平滑度濾波預處理技術
由于在實際計算機視覺捕捉過程中圖像噪點是難以避免的問題,以此在對圖像中運動物體進行檢測前,應該相對這些噪點進行預處理,降低環境噪聲對圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線性和非線性。其中線性處理方式就是通過計算機處理設備的簡單運算,對圖像當中的噪點進行直接清除,但這一技術使用后會造成截獲圖像模糊不清的情況,因此僅對噪點較少的圖像采用該處理方式;非線性濾波處理則是利用復雜的圖像處理運算,將截獲圖像當中的噪點無限縮小,使其不對圖像整體造成影響,并且可以有效保證圖像的局部調整,但這種處理方式在運算時速度沒有線性濾波處理快,因此需應用在噪點較多,圖像信息較復雜的處理當中。
2)圖像的填充預處理技術
這一處理技術在使用過程中運算速度較慢,主要是由于其需要對逐幀的圖像均進行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運動物體之后,利用計算機系統自身的邊緣檢測處理技術,對物體的輪廓進行辨識,并利用形態學上的漫水填充方式對運動物體周圍的噪點進行顏色填充,減小其對畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似,但這種處理技術主要是針對于噪點進行腐蝕和膨脹,使其在畫面當中所占比例擴大,但對運動物體本身不造成影響,這使運動物體和噪點之間的差異就會更加明顯,就可以將噪點的影響降到最低,但這種處理方法的效果和攝像機本身的性能、質量等有著密切的關聯。
3)背景的實時更新預處理技術
在進行運動物體和背景分離過程中,計算機系統需要對圖像上的背景元素進行辨識,并對其開展初始化處理,這樣就能夠為后期實時背景圖像的差異進行凸顯,以增加前景圖像的效果,降低噪點對圖像的影響。在運用這一技術時,首先要先對第一幀的圖像進行確定,并將第一幀圖像當中的背景圖像元素進行辨識,然后在后期圖像更新和運動物體檢測過程中對背景進行實時更新處理。在更新的過程中其流程主要包括:首先,系統要對所讀取的畫面進行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉變為單通道灰度值;第三,對轉變后的圖像進行高斯平滑度濾波處理,將圖像當中的噪點進行去除;第四,采用形態學噪點填充技術對圖像當中的噪點進行二次處理,以獲得所需要更新的背景圖像。
3.3 前景運動物體的提取技術
在計算機視覺技術進行運動物體的檢測時,只有有效保障檢測流程的準確度,才能夠有效保障對前景運動物體的跟蹤效果。其主要分為兩大步驟,其一是對二值化后的圖像數據進行分割處理;其二是在圖像分析前對其進行充分的填充處理,保證前景圖數據的完整性。同時,在前景圖像提取的過程中也分為多個步驟,其包括:首先,對所提出的前景圖像和背景圖像進行差分處理;其次,將差分處理后的圖像二值化處理;第三,對背景當中前景物體的輪廓或邊緣進行辨識,根據前景圖像的輪廓對其進行填充。由于在實際操作過程中,攝像頭所處環境的變化較大,并且會在不同場所內的不同角度捕捉畫面,因此就需要在前景圖像提取時有效提高背景圖像實時更新的效果。
利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開,從而使目標運動物體能夠呈現獨立化,并且閥值分割方式開展前要相對每個像素點進行確定,判斷其是否位于灰度值的范圍內。而將該圖像的像素灰度和閥值進行對比后會出現兩種結果,分別是灰度值低于或高于閥值。在實際應用過程中,有效確定圖像的分割閥值T,就能夠降低環境當中光照因素對圖像質量的影響。
4 計算機視覺技術當中的三維重建技術
1)三維重建的視覺系統
計算機視覺技術在對圖像進行捕捉時可以視為是對大量的圖像信息進行處理,從攝像機的視覺角度出發,其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數據,而這種三維空間數據能夠提升對運動物體所處空間位置、距離等描述的準確性。在三維重建視覺系統工作過程中,其相對基本的圖像數據框架進行確定,然后利用一個坐標點建立2.5D圖像數據,即以此點為視角能夠觀察到的圖像數據,再將2.5D圖像數據進行整合從而建立三維圖像。
2)雙目視覺系統
當人體利用雙眼在不同角度、同一時間內觀察同一個物體時,就可以利用算法來測量該物體和人體之間的距離,而這種方法也被稱為雙目立體感,其應用的原理主要是人體視覺差所帶來的影響。同時利用兩臺攝像機對同一圖像從不同角度進行觀察,就能夠獲得人體雙目觀察后的效果,因此這一三維重建技術也被稱為“雙目視覺系統”。兩臺不同的攝像機即可代表人體雙眼,其對圖像進行逐幀捕獲,但由于角度不同和環境影響因素的差異,因此造成了圖像差異,必須對其捕捉的圖像進行預處理。
3)三維重構算法
在計算機視覺技術中對于視頻流的采集主要依靠的是彩色攝像機、紅外攝像機、紅外接收攝像頭等設備。還可以利用微軟所提供的Kinect設備,在進行運動物體檢測前能夠對NUI進行初始化處理,將系統內函數的參數設定為用戶信息深度圖、彩圖、骨骼追蹤圖等數據。在使用Kinect設備對視頻流進行打開時,其可以遵循三個步驟,其一是彩色和深度數據的處理;其二是根據數據的索引添加顏色信息,并將其引入到深度圖數據當中;其三是骨骼追蹤數據。
5 結束語
計算機視覺捕捉技術是現代計算機應用當中較為先進的內容,其應用范圍較廣,對于運動物體的捕捉準確度較高,能夠有效推進現代計算機模擬技術的發展。
參考文獻:
[1] 張???基于Opencv的人手識別與跟蹤定位技術研究與實現[D].昆明: 云南大學,2013.
關鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利
中圖分號:C18 文獻標識碼:A
0引言
造成交通事故的原因25%-30%產生于疲勞駕駛,因此疲勞駕駛已成為誘發交通事故的重要因素。國內外專家和學者針對疲勞駕駛的檢測開展了大量的研究工作,目前研究的重心主要集中在基于計算機視覺的疲勞駕駛檢測,因此對基于計算機視覺的疲勞駕駛檢測的相關專利進行分析尤為必要。
1基于計算機視覺的疲勞駕駛檢測專利申請數據分析
1.1全球專利申請量趨勢
從圖1可以看出,基于計算機視覺的疲勞駕駛檢測專利申請量從1990-2001年間處于技術研發初期,專利申請量相對較少。從2002年開始該領域的專利申請量逐漸呈現持續增長趨勢,并在2014年達到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對疲勞駕駛的檢測也越來越重視,相應的研究也正不斷增加?;诖耍诮窈蟮囊欢螘r間內,相關的專利申請量有望繼續保持。
1.2專利申請產出地區分布
目前各領域的專利申請量主要集中在中國、美國、韓國、日本和歐洲,通過對該領域在中國、美國、韓國、日本和歐洲的專利申請量進行統計分析發現,中國的申請量以48%的占比雄居第一,其他幾個地區的申請量相差不大,具體如圖2所示。
1.3在華專利申請量變化趨勢
圖3為1990年至2014年基于計算機視覺的疲勞駕駛檢測在華的申請量變化趨勢圖,由該圖可以看出,1990-2002年是技術的萌芽期,在2003年以后申請量才呈現逐年增長的趨勢,并且在2012年-2014年將均維持在較高的申請量。因此,該領域國內雖然起步較晚,但是最近幾年申請量相對其他地區卻具有壓制性的優勢。
1.4在華主要申請人分析
圖4展示了在華主要申請人的申請量份額,主要以科研院所和大型汽車企業為主,其中吉利汽車公司以領先優勢排名第一。
2主要技術分支的專利申請分析
基于計算機視覺的疲勞駕駛檢測的主要技術分支有:基于人眼的駕駛疲勞檢測、基于人臉的駕駛疲勞檢測、基于嘴巴的疲勞檢測。下面從三個技術分支的發展概況、三個技術分支的主要工作原理及重點專利等方面進行分析。
2.1全球專利申請主要技術分支的申請量趨勢圖
由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測的申請量呈現較快增長,申請量也較基于嘴巴的疲勞檢測的申請量大,體現了該領域近年來的發展趨勢,并體現出基于人眼和人臉的駕駛疲勞檢測的技術分支發展已較為成熟。三個技術分支在2006年之前,申請量的差別不大且數量均較小,顯示出在2006年以前三個分支的區別并不明顯,發展也較為緩慢,這說明基于計算機視覺的疲勞駕駛檢測也是近10年才興起的一項技術,它依賴于圖像處理技術的發展水平。
2.2在華專利申請主要技術分支的申請量趨勢圖
由圖7可知,三個技術分支在2006年以前均只有零星的申請量,這與該領域在全球的發展情況相符合,基于人眼的疲勞駕駛檢測在華申請量自2006年以來呈現穩步增長,且近年來申請量最大。基于人臉的疲勞駕駛檢測申請量雖小于基于人眼的疲勞駕駛檢測,但近年來的申請量也呈現出穩步增長的勢頭。然而,基于嘴巴的疲勞駕駛檢測雖有增長趨勢,但申請量一直都較小。由此可知,在國內疲勞駕駛的檢測主要是采用人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,也是今后國內在該領域的發展趨勢。
3結語
通過對基于計算機視覺的疲勞駕駛檢測專利的申請量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個技術分支的申請量趨勢分析可知,基于計算機視覺的疲勞駕駛檢測在近10年取得了較快發展,這與計算機圖像處理技術的發展密不可分;同時,科研院所作為該領域研究的主體,應加強與中小企業的合作。國內疲勞駕駛的檢測研究主要集中在人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,同時,基于人眼的疲勞檢測其發展方向明確,后續發展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實際的要求。
參考文獻
[1] 朱淑亮.基于視頻圖像分析與信息融合的駕駛員疲勞檢測技術研究[J].濟南:山東大學,2011.
[2] 劉學.基于人臉圖像分析的疲勞駕駛檢測方法研究[J].南京:南京航空航天大學,2012.
[3] 張靈聰,王正國,朱佩芳,等.汽車駕駛疲勞研究綜述[J].人類工效學,2003.
【關鍵詞】株高 HALCON 雙目視覺 誤差修正
1 引言
計算機視覺技術是近幾年來發展較快的信息處理技術,隨著圖像處理技術的專業化、計算機硬件成本的降低和速度的提高,計算機視覺的應用已變得越來越廣泛,其中不乏在農業中的應用。
株高是植物生長指標的重要參數,是一個物種爭奪陽光的能力的主要決定因素[1]。對于作物來講,株高參數是作物產量預估不可或缺的參數。
然而對于具體的利用機器視覺方法直接測量株高的研究還是比較少的,本文就是利用HALCON軟件,采用雙目計算機視覺方法來實現株高的測量。
2 雙目視覺原理
雙目視覺的基本原理是從兩個視點觀察同一景物,獲取不同視角下的兩幅圖像,然后根據三角測量原理計算不同圖像對應像素間的視差(disparity ),獲取景物的三維信息,從而實現場景三維重構。
根據兩個攝像機位姿的不同,雙目視覺有多種模式,常用的有雙目橫向模式,雙目橫向會聚模式以及雙目縱向模式(也稱雙目軸向模式)。
為了增加測量精度,基線一般不能太小,但基線長度也不可太長,否則,由于物體各部分相互遮擋,兩個攝像機可能不能同時觀察到目標點。
圖1是會聚雙目成像中的視差原理圖。圖中給出兩鏡頭連線所在平面(XZ平面),兩鏡頭中心間的距離(即基線)是B,兩光軸在XZ平面相交于(0,0,Z)點,交角為(未知)?,F在來看如果已知像平面坐標點(x1, y1)和(x2, y2 ),如何求取世界點W的坐標(X,Y,Z)。
根據相似三角形的關系可以很明顯得出: (2.1)
(2.2)
(2.3)
其中r為從(任一)鏡頭中心到兩系統會聚點的距離(未知)。將式(2.2)和(2.3)聯立, 可得:
(2.4)
上式把物體和像平面的距離Z與視差d直接聯系起來,若想求解式(2.4),除視差d外,還需要知道x1和x2本身。另外,由圖1可以得到:
(2.5)
代入式(2.2)或(2.3)可得:
代入式(2.2)或(2.3)可得:
(2.6)
現實測量中,兩相機的光軸與世界坐標Z軸的夾角不可能相等,不過即便如此,也只會引入幾個待確定的三角函數,而這些三角函數在相機標定時即可確定。
3 測量過程
實現該測量過程包括如下幾個功能模塊:圖像獲取、攝像機標定、特征提取、立體匹配與三維信息恢復、后處理。本實驗采用是分比率為960×720的雙攝像頭。被測區域大小約為56cm×42cm,所以采用的標定板應為被測區域1/3大小的HALCON專用的200mm標定板。標定數為24×2張圖片。利用HALCON自帶的標定助手,可以輕松實現單目標定。
雙目標定時,需要有15張以上左右相機相同時刻拍攝的標定板的圖片。再利用for循環,find_caltab函數,find_marks_and_pose函數以及binocular_calibration函數,可以實現雙目標定。將標定過程中,獲得的攝像機的內參以及兩個攝像機相對位置關系作參數傳遞給函數gen_binocular_rectification_map,可以很好地實現雙目視覺校正的目的,得到兩幅校正后的圖像,還能得到校正后虛擬立體視覺系統中兩個攝像機的內參和外參。
不同種類的植物其株高定義不同,測量方式也不盡相同。本文研究的株高只針對直立型的,是指從植株根部露出土壤部分到植株最高處的株高。
先利用gen_binocular_rectification_map函數為map_image函數提供控制參數,再通過map_image函數對采集到的圖像做校正處理,利用threshold函數,fill_up_shape函數以及select等函數找出校正后圖像中植株的最低和最高點,利用intersect_lines_of_sight函數,可獲得植株最低點和最高點的真實三維坐標,最后通過幾何運算得到雙目測量結果。
我們在圖像采集時就應該考慮到,攝像頭應該稍微帶一點俯拍的角度,保證左右兩幅圖像上最高處均為現實坐標中的最高處。切忌俯拍角度不可太大,否則由于拍攝角度而引起的像差會很大,對結果將會有很大的影響。
經過以上幾步驟得到的三維坐標,常因各種原因而存在一定的誤差,需要進行誤差校正。我們對已知高度的對象進行了測量,得出結果如表1:
通過上述數據得出的修正關系如下:
y=-0.0002x2+1.0699x (3.1)
其相關系數R2=0.9993
4 實驗結果
我們對三種植物進行了測量得出的結果如下:
從測量結果中可以看出,修正后相對誤差控制在2%之內,可以接受。誤差引入的原因可能如下:
1、標定板的選擇決定了標定精度。一定要選用高精度的標定板,且標定板的大小應約為測量范圍1/3大小。
2、相機是圖像獲取的根本,高質量的圖像離不開高分辨率相機,但是高分比率,高解析度的相機又會帶來成本上的提升。本文中,對于390.0mm左右的對象,1個像素的誤差可以帶入約0.4mm的實際誤差。
3、本文所采用的算法只能針對比較理想,比較直的植株,算法的不斷優化,才能不斷減少誤差,提高精度。
5 結語
本文介紹了一種基于HALCON的,利用雙目視覺測量株高的方法。對于直立型植物,通過對立體匹配與三維信息恢復結果的誤差修正,其株高測量相對誤差不超過2%,方法具有一定的可借鑒性。
參考文獻
[1]章毓晉.計算機視覺教程 [M].北京: 人民郵電出版社,2011.
作者簡介
郝慧鵬(1988-),男,內蒙古烏蘭察布人,碩士研究生,主要研究方向為計算機視覺技術在農作物檢測上的應用。
指導老師
田躍(1956-),男,北京人,北京科技大學數理學院物理系教授,北京市弱磁檢測及應用工程技術研究中心副主任。
作者單位
【關鍵詞】平面測量技術;鉛球項目;成績測量
0 引言
隨著計算機處理能力的提高和傳感器技術的發展,近年來基于視頻圖像處理的計算機視覺技術已成為圖像處理領域的研究熱點,該技術在眾多的領域中都有十分廣泛的應用[1]。
視覺是人類認識世界、觀察世界的重要手段。人類從外界獲取的信息量約有 75%來自視覺系統,這表明視覺信息量十分巨大以及人類對視覺信息有較高的利用率。人類利用視覺的過程可看作是一個從感覺到知覺的復雜過程,即從感受到的對三維世界的投影圖像到依據投影圖像去認知三維世界的內容和含義[2]。
計算機視覺技術是指利用計算機實現人的視覺功能,既對客觀世界的三維場景的識別、感知和理解。該技術包括是仿生學方法及工程方法,仿生學方法是模仿人類視覺功能的結構及原理,建立相應的處理系統,完成類似的工作和功能;工程方法是從分析人類視覺系統著手,并采用任何現有的可行手段實現人類視覺系統的功能[3],該方法的特點是只關心系統的輸入和輸出。計算機視覺的主要研究目標是建成計算機視覺系統,完成各種視覺功能。也就是說,即要能借助各種視覺傳感器(如 CMOS 攝像器件、CCD等)獲取現實世界的圖像,而感知和恢復 3D 環境中物體的幾何性質、運動情況、姿態結構、相互位置等,并且要對客觀場景進行識別、解釋、描述、進而做出決斷。目前,計算機視覺技術在體育運動中也得到了廣泛的應用,利用該技術不僅可以從不同的視角觀察運動員的動作,而且能將運動員速度、加速度、所在位置等數據進行量化處理,使體育訓練及比賽擺脫依靠傳統經驗分析及判別的狀態,從而進入科學化、數字化的狀態,而且還可以完成競技體育項目的成績測試[4-5]。
在測試項目中鉛球成績的測量仍采用皮尺丈量法。這種方法存在著三個方面的缺陷,一是皮尺本身具有彈性以及易折疊特性,二是受場地的凹凸不平,三是人為因素影響較大。由于這三方面的作用, 故在鉛球成績的測量精確度受到極大的限制。針對這一問題本課題提出了一種基于同視場(鉛球場地)測量地平面坐標的單攝像機模型[6-7]。該模型利用透視投影幾何關系,對攝像機內部參數進行標定,然后,建立相應的網格匹配數學模型,通過單目CCD攝像機像面坐標,測量鉛球落點的地平面坐標[8]。成功的解決了鉛球著點測量在雙目視覺交匯組合測量存在的死角影響系統的測量范圍的問題,另外,單目視覺測量系統也避免了雙目視覺系統存在對應特征點匹配問題。
1 平面測量原理
圖1 鉛球的2D場景坐標系
鉛球場地是一個扇形區域(如圖1)。假設建立一個如圖1的2D場景坐標系,首先要做的事是要確定場地上指定點的真實坐標與采集到的圖片的指定點象素坐標之間的對應關系,即要找到這兩種坐標系之間的轉換關系。而這種轉換關系可以用平面測量的相關技術獲得。在計算機視覺中,所謂的平面測量,就是從圖像中獲得2D場景信息。在實際的測量中,我們可以通過在圖像上標定一定數量的坐標點來確定圖像中場地指定點的象素坐標和真實世界中的指定點的現實坐標之間的單應矩陣。
我們獲取一幅2D場景S的圖像I,通過S與I之間的N(N>=4)對對應點,就可以確定它們之間的單應矩陣H。
令:
H=h■,h■,h■=h■,h■,h■h■,h■,h■h■,h■,h■(1)
在H的九個元素中,有八個獨立比率,即一個單應有八個自由度變量,一個常數1。因此,在H中,往往設置h■=1。
令(x■,y■)∈I,x■■,y■■∈S為一對對應點,i=1,2,…N。由每一對對應點,根據圖像與場景之間的單應關系,我們可以得到兩個線性方程:
其中,h是矩陣H的向量形式,
于是我們可以得到2N個方程,寫成矩陣形式為:
AH=0(3)
其中
因此,要求得8個參數的單應矩陣,至少需要4個對應點。在實際的測量中,為了提高精度,每個模板平面上提供的對應點數目都會超過4個。
當N>4時,我們可以用奇異值分解法(SVD)[14]求最小二乘解h。
求得單應矩陣后,利用公式(2),就可以計算出圖像上指定點對應的真實坐標值,從而計算出鉛球投擲的距離。
2 實驗結果與分析
表1
2.1 實驗結論(下轉第38頁)
(上接第21頁)經實際測量的6個標定點(如圖1)的坐標分別為A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639) 。為了測試本文提出的測量模型,在反復測量鉛球投擲實驗中選取了典型的10個測試樣本,其中鉛球落點10個。
2.2 誤差分析
從表1中我們可以看到人工測量值和系統測量值有一定的誤差,分析誤差產生的原因有如下幾種:
1)數字 CCD 鏡頭的光學性能引起的誤差,如焦距、畸變和光學中心誤差等通過攝像機內部參數校正來解決。
2)攝像機的支架及底座一定要有足夠的穩定性和剛度,在視頻圖像獲取過程中應保證攝像機的相對位置穩定不動,由意外情況所造成的誤差在計算中應予以剔除。
3)環境的變化將對測量結果產生影響,因此測量中要及時修正背景圖像。
4)人工測量本身就會與真實值產生一定的誤差。
3 總結
本論文首先介紹了課題背景,對單目視覺測量的研究現狀和測量建模在國內外的研究現狀進行了分析和歸納,同時分析了視頻圖像處理技術在體育項目應用現狀,將基于單目視頻圖像處理技術的鉛球成績測量作為切入點,對數字圖像處理技術在田徑運動中應用的關鍵技術進行了研究。結合鉛球場地的特點,提出一種基于視頻圖像的鉛球測量方法,并通過實際應用證明了該方法的可行性。
【參考文獻】
[1]Criminisi A,Reid I,Zisserman A. A plane measuring device[J].Image and VisionComputing,1999,17(8), 625-634.
[2]Lorenzo Bruzzone, Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).
[3]L Sajó, Z Ruttkay, A Fazekas. Turk-2, a multi-modal chess player[J]. International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.
[4]Lichtenberg, D.B., Wills, J.G., Maximizing the range of the shot-put[J]. American Journal of Physics,1978,46:546-549.
[5]Maheras, A.V.. The relationship between the angle of release and the velocity of release in the shot-put, and the application of a theoretical model to estimate the optimum angle of release (throwing)[D].University of Kansas., 1995.
[6]Antonio Plaza, Jon Atli Benediktsson, Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment,2009,9,113(1):S110-S112.