0引??言
?南疆是中國最大的紅棗生產基地,目前紅棗病蟲害已經成為制約南疆紅棗產業發展的主要因素。受到病蟲干擾后,紅棗內部會發生一系列變化,這種變化積累到一定程度后會直接表現在外觀上,甚至會引起棗樹發生變化,例如嚴重的病蟲害會導致棗樹的樹葉發生病變。眾所周知,植物進行光合作用依靠的就是綠葉,一旦綠葉受損,將會嚴重影響有機物積累,使得果實甚至果樹的生長發育受到威脅。病變會使紅棗的光譜發生變化,因此利用高光譜系統可以對紅棗病蟲害實現最有效的監管。
1?紅棗病蟲害高光譜圖像采集
高光譜圖像采集的過程如下:?第?1?步,依靠構建起來的高光譜圖像系統對每個待測的紅棗進行圖樣采集,同時為了更加便于研究圖像,還要進行相應的操作。第?2?步,將經過處理操作后的圖像敏感區域進行灰度值計算,這個灰度值也直接反映了紅棗的光譜圖像信息,具體而言就是首先要確定樣本,而樣本一般要滿足?2?個要求:?(?一)?單個病變斑點的灰度值應該在?30?個左右;?(?二)?像素的灰度值在樣本空間中具有均衡的特征。對于標準的紅棗取樣就與此存在一定的差異性,應該從整個紅棗的頭部、中部以及下部取?3?個標準樣本作為研究對象。對于參照對象的選取應當遵循隨機性的原則,但是要控制參照對象相同且適宜,即保證取樣的部位應當均勻包含?30?個像素光譜灰度值。對于同種樣本還要保持樣本容量為?50,由于在取樣的過程中涉及到多種病害,各個病害的樣本又構成獨立的樣本空間,因此?6?個樣本總的樣本容量即為?300。第?3?步,從各個不同病害以及正常空白對照的樣本中隨機選出?30?個試驗樣本,其他的樣本用作驗證測試。由于在圖像的采集過程中不可避免地存在聲音干擾,所以要準確分析圖像就要不可避免地進行處理。通常的去噪方法是在有光與無光的環境中分別采集相應的圖像,分別記作?W、D,然后利用公式計算高光譜反射率:
2?紅棗病蟲害高光譜特征譜段的最佳篩選
在南疆紅棗病蟲害高光譜數據采集過程中,由于受各種環境因素及人為因素的制約,采樣數據存在隨機誤差。為了提高紅棗高光譜譜段篩選的準確性,通常采用均值置信區間估計法則將采樣誤差限制在允許范圍內。假定樣本容量足夠大(?n≥85時,則所有隨機分布的均值能夠呈現正態分布的收斂圖。采集的圖像信息的概率為?P,因此可以得到在任意的第?i?波段光譜反射率均值?μi置信區間與置信水平?α?的關系為:
式中:?Xi為第?i?波段經過高光譜反射率所有測量結果的平均值;?Zα?/2為抽樣誤差;?Si為測量樣本標準差(?nm)?;?α?為顯著性程度。μi的置信區間為:
?
由于波段取值具有一定的限制,那么所有紅棗病蟲害高光譜波段的置信區間也就直接成為高光譜反射率均值置信區間帶,并且以?μi作為比對光譜基準。所謂特征選擇就是從研究對象中選取一部分作為試驗對象,因此試驗樣本應當小于總個體數。當進行圖像采集時,往往會得到含有大量圖像的數據,這就為數據分析帶來了極大的難度。如果不進行特征篩選,就會在現有的波段中夾雜很多無用的波段,并直接影響計算效率,加大計算難度,同時還可能使有效的波段被忽略。最普遍的方式就是刪去均值置信區間帶的重疊波段,因為這種處理方法不會影響圖像整體的物理信息。采用?Manhattan?距離法構建病蟲害紅棗與紅棗樣本數據庫光譜基準的相似度,Manhattan?距離用如下公式計算:
式中:?D(i)為?Manhattan?距離,nm;?Xi為光譜基準第?i?波段光譜反射率?n?次測量均值;?xi為病蟲害紅棗第?i?波段光譜反射率;?A?為篩選后的波段的所有組合。一般而言,Manhattan?距離直接反映了病害紅棗與數據庫中的樣本差異的大小程度,原則上是距離越小越精確。常用的方法就是判斷所計算出來的結果是否在置信區間中,如果在其中則說明準確,樣本與標準較相近,反之則不準確。
式中:?P?為最小最大區間相似度;?M?為紅棗特征區分波段總數;?Yi為病蟲害紅棗的第?i?波段的光譜反射率;?H(?Yi)?反映了第?i?波段的反射率有沒有達到基準光譜的要求,其取值只有?2個,是一種真假關系,在區域內為真,取值為?1,反之為?0。
3?高光譜特征提取及波段選擇算法
3.1?特征波段的選擇
經過系統處理的高光譜圖像一般被儲存在一個三維空間中,其中任何一個波段都與光譜特征具有一一對應的線性關系。所以,選擇光譜圖像的實質是對圖像波段進行篩選,選出的波段在整個樣本波段中具有典型特點。對選出的圖像要進行相應的操作處理,對選擇的波段數量也有一定限制。利用這種方法一方面降低了數據的復雜度,另一方面最大程度保留了最準確的信息。最后利用逐步判斷剔除法篩選波段,對相應的波段進行測試,在進行提取篩選時的主要判斷標準就是判斷各個波段在整體波段中作用的強弱。假如在經過若干次處理后,整個樣本空間不再發生任何形式的變化,那么就可以認為當前空間中剩下的波段就是篩選后期望得到的波段。
3.2?特征波段的提取
特征波段的提取建立在各光譜波段間進一步優化調整與整合的基礎上,是對一個光譜特征空間實現降維的方式,這種逐步判斷剔除的實質也是降低原始圖像數據的復雜度,并對圖像進行優化處理。它是在不影響整體結果的前提下調整圖像數據,因此降低了數據的復雜度,方便分析數據,此外這種處理所得到的新數據也具有相互獨立的典型特點。
3.3?波段選擇算法分析
假設?X?=?(?x1,x2,…,xN)?=?(?X1,X2,…,XP)T為?P?維隨機變量,反映了采集的病害紅棗圖像。設總的樣本像元數為?N;總的波段數為?P;?xi(?i?=?1,2,…,N)?代表波段的第?i?個像元;?Xk(?k?=?1,2,…,P)?表示波段的具體序號。X?均值向量和協方差陣公式如下:?
設?λ1,λ2,…,λP(?λ1≥λ2≥…≥λP≥0)?為∑x的特征根,t1,t2,…,tP為相應的單位特征向量。主成分變換如下:
Y?=?(?Y1,Y2,…,YP)T=?AX
式中:?A?為主成分變換矩陣,前提是?Y1,Y2,…,YP不相關且方差?D(?Yi)?(?i?=?1,2,…,P)?要大;?Y?分量?Y1,Y2,…,YP分別是?X的第?1,第?2,…,第?P?主成分的充分必要條件是:?A?=?TT=?(?t1,t2,…,t)?。
在主成分分析中:
式中:?Vm為主成分?Y1,…,Ym貢獻率的疊加,這是在進行波段選擇時的主要考量參數,若?Vm大于閥值的前?m?個主成分置換原來圖像,則大大簡化了運算,然而確實失去了原始圖像的數據信息。為了有效解決這一問題,就開發一種新的波段選擇法,它是從原始波段中選取一部分作為樣本,因此沒有更改原有波段的信息。設?δn是∑x對角線上的值,主成分?Yk與原來第?i?個波段Xi的相關系數
并且有:
就會導出所有?m?個主成分(?Y1,…,Ym)?原始第?i?個波段的貢獻率?Vi,是?Xi分別與?Y1,…,Ym相關系數的平方和,即:
Vi是實現波段選擇的主要參數,代表了當前波段在整體中發揮的作用。具體來說,假如?V5=?0.4,就反映了第?5?個波段中?40%?的數據信息都在樣本空間中,發揮的作用為?40%?。假如是波段的總數與樣本空間的波段數,就會得到?1,說明樣本空間的所有信息都來自該波段信息的疊加,但是這種研究沒有任何實際意義。在通常情況下,取?Vm≈0.?99,m?<<?P,這就保證了所計算的結果?Vi具有實際意義,可以作為波段選擇的主要依據。在進行波段篩選時,還要制定一個具體的標準,在此記為?Tm,當?Vm≥Tm時,就可以得到主要成分的數目,然后分別計算各個主要成分的?Vi,根據這個參數進行波段選擇。由于這種計算方法避免了對圖像的處理或變換,因此大大降低了運算難度,簡化了運算量,提高了運算的準確率。
4?結果與分析
4.1?特征選擇及其判別結果分析
最后將剩下的用于驗證試驗的波段進行處理,將其放在預定的置信區間內的一半波段數據進行處理、分析,根據Wilks'Lambda?統計量,選定南疆紅棗棗銹病、棗瘋病、黑斑病、縮果病和正常紅棗?12?個特征波長?480、495、510、520、560、570、635、660、735、740、745、760?nm,特征曲線如圖?1?所示。利用選擇的?12?個特征波段的光譜參數,對南疆紅棗棗銹病、棗瘋病、黑斑病、縮果病和正常紅棗無病區域進行距離判別分析,表?1?即為新建的數據模型函數表達式。然后利用判斷公式進行重新檢測,檢測后的判斷結果見表?2。從表?2?可以看出,所有的判斷沒有任何誤差。將未參加建模的?150?個圖像樣本作為測試集,對模型進行檢驗測試,結果對紅棗棗銹病、棗瘋病、正常紅棗的識別正確率是?100%?,對紅棗縮果病和黑斑病的識別正確率分別為?93%?、87%?,測試樣本的平均識別正確率為?96%?,這就強有力地證明試驗構建的線性判別模型具有實質性的效果。
圖1???5類樣本的光譜反射率均值
表1???5類樣本的逐步判別函數
表?2?訓練和測試樣本集的逐步判別結果
4.2?特征提取及其判別結果分析
與驗證試驗類似,將剩下的一部分樣本置于相同的置信區間中進行數據處理分析,然后利用?PROC?CANDISC?判別研究,利用?Can1和?Can2典型變量組建的線性判別模型見表3。然后基于判定函數對各個試驗以及驗證樣本進行二次檢驗,結果示,這種模型對紅棗棗銹病、棗瘋病等眾多典型病害的檢測完全準確,這也有力地證明了此模型的構建完全達到了預期功效。
表?3???5類樣本?Candisc?判別函數
4.3?波段選擇算法分析
利用波段選擇法能夠輕易地確定主要成分的波段,然后再輔之以?PCA?的波段選擇算法進行深層次處理分析。在這種新的波段選擇算法中,應當提前設置?Tm、Tv的具體數值,這也是進行波段選擇的前提條件。在確定主要成分之后對其進行分類處理,新的處理結果見表?4,可以發現這種處理方案實現了對數據的優化調整,保證了原始圖像的相關信息沒有任何改變。
表4??PCA的波段選擇算法
5結論與討論
利用高光譜成像技術并結合主成分分析波段選擇算法識別南疆紅棗棗銹病、棗瘋病、黑斑病、縮果病和無病區域。研究開發的高光譜圖像采集系統,實現了對采集圖像的處理功能。然后經過各種判別方法的操作,對波段的進一步分析篩選,對所得到的波段進一步調整,構成新的模型?-?線性距離判別模型。這種新的模型無論是訓練效果還是測試樣本的檢測效果都讓人滿意。此外,它依靠建立的判別函數還實現了對其他樣本的分析與判別等功能,其識別正確率均達?100%?,從而確立了南疆紅棗病蟲害特征譜段選擇的最佳模式。
萊森光學(深圳)有限公司是一家提供光機電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應用系統的研發、生產和銷售。
審核編輯:符乾江
評論
查看更多