一、引言
水生態空間是指河流、湖泊、水庫、濕地、蓄滯洪澇區的管理和保護范圍,承擔著維持水生態系統健康穩定、保障水安全等多重功能,是為人類提供水生態系統服務的重要生態空間。近年來,由于多重因素的影響,水生態空間的結構和功能受到威脅和破壞水生態空間范圍內的地物組成是影響水生態空間健康狀況的重要因素,因此了解和掌握水生態空間的重要地物類型分布可以為其健康評估以及未來生態規劃起到關鍵性作用。遙感具有快速、實時和大范圍的動態監測能力和優勢,發展基于遙感技術的水生態空間范圍內地物類型精細分類方法可以為其綜合性治理與規劃提供技術支持。
光學遙感影像是地物分類的主要數據源,可分為多光譜遙感和高光譜遙感分類。多光譜遙感數據種類和數量多,空間分辨率高,廣泛應用于地物類型分類研究。但由于多光譜遙感數據獲取到的波段數較少,對異物同譜的地物識別精度有限。相比之下,高光譜遙感數據能夠獲取到可見光到短波紅外范圍內數百個窄波段的反射率數據,在精細地物類型分類方面具有巨大的應用潛力。但由于高光譜數據種類和數量較少且空間分辨率一般低于多光譜遙感數據,其應用相對匱乏。近年來,隨著中國多顆高光譜衛星的發射,極大提高了高光譜數據的獲取能力。 目前,高光譜數據在水生態、水環境等方面的應用較少,因此亟需評估高光譜數據用于水生態空間范圍內地物精細分類的可行性并探索適宜的分類方法。
研究基于高光譜數據的北京市密云水庫水生態空間地物類型精細分類方法,確定水生態空間重要地物識別的最優特征子集,實現水生態空間地物精細分類。此外,通過對高光譜遙感數據與多光譜數據的分類結果進行比較,分析了高光譜遙感數據在水生態空間地物精細分類的優勢。
二、研究區及數據源
2.1研究區與地面特征
選擇北京市密云水庫水生態空間范圍作為研究區,如圖1所示。根據密云水庫水生態空間典型地類的分布特點,可以將地物精細分類的類別分為5類:水體、不透水面及裸土、板栗林、農田和草地、其他林地。
圖1 研究區地理位置
表1 訓練集和驗證集中的樣本數量
為了獲取研究區地物類型的實際分布數據,于2022年8月1日至4日開展了野外調查工作,在調查同期進行地物類型的樣本選擇,各類別多光譜影像上獲取的訓練集和驗證集樣本數列于表1。由于各類型的包含樣本量不同,所以本研究對每個類型單獨進行隨機劃分,訓練集和測試集的樣本比例約為2:1。
三、研究方法
3.1 J-M距離分析
J-M距離是一種判斷類別可分性的重要指標,研究表明相比于其他指標(如離散度、J-M距離)更適合用于判斷類別可分性。J-M距離的取值在0~2之間,值越大代表可分性越好,其中0代表完全不可分,2代表完全可分,當J-M距離大于1.9時說明可分性較大.主要采用J-M距離判斷類別之間的可分性,計算公式如下:
3.2研究方法
3.2.1分類體系及樣本選取
采用隨機森林分類算法(RF)構建水生態空間地物精細分類模型(見圖2)。RF算法是由多棵決策樹組成的集成算法,與神經網絡、支持向量機等機器學習算法相比,RF算法魯棒性較強,運算效率高,具有處理高維數據和不均衡數據的優勢。RF算法利用自助采樣策略隨機且有放回地從原始數據集中抽取一定數量的樣本,對每個訓練集建立決策樹分類模型。
圖2隨機森林分類算法
RF算法中,特征選擇的隨機性也使得每個特征子空間存在一定差異。因此,特征選擇和樣本集自助采樣過程共同增加了決策樹構造的隨機性。而RF的整體分類結果是每棵決策樹分類結果的綜合,泛化誤差低。
根據已有研究可知,RF算法中有兩個重要參數需要設置,分別為特征子集的個數和決策樹的數量。兩個參數的值通過交叉驗證確定。其中特征子集個數的取值為1~5,步長為1,決策樹的數量的取值為100~600,步長為100。通過對特征子集的個數和決策樹的數量進行組合,分別構建模型,對比模型精度確定最佳的取值。最終確定特征子集的個數和決策樹的數量的值分別為2和300。RF算法不僅可以輸出分類結果,還能夠輸出分類特征的重要性排序。
四、結果與分析
4.1典型地物高光譜反射特征
圖3(a)為5種地物類型的高光譜反射特征(樣本平均值),可以發現每種地物類型的光譜反射曲線均符合其典型的反射光譜特性。其中林地(板栗林和其他林地)、農田和草地在近紅外的混淆程度較高,但在可見光、紅邊波段和短波紅外波段的區分度較大。圖3(b)給出了5種地物類型的NDVI分布,從圖3(b)可以發現,不同地物類型NDVI分布區間有一定的差別。農田和草地的NDVI分布值低于林地(板栗林和其他林地),但板栗林和其他林地的NDVI混淆程度較嚴重,說明僅利用紅和近紅外譜段無法實現板栗林的精細識別。
圖3 典型地物光譜曲線 (a) 及其 NDVI 分布箱形圖 (b)
4.2 J-M距離可行性
根據高光譜數據得到的結果可知,不透水面及裸土和水體與其他類別具有明顯的可分析,J-M距離大于1.9。板栗林、農田和草地、林地三者之間J-M距離在1.5~1.8范圍內,說明三者之間存在一定的光譜可分性,但也存在一定程度的混淆。
其中,農田和草地與板栗林和其他林地之間的J-M距離分別為1.7260和1.7470,而板栗林與其他林地的J-M距離為1.5003,可分性弱于其他地物類型之間的可分性。由多光譜數據計算的JM距離可以發現,農田和草地、不透水面及裸土、其他林地和水體之間的J-M距離要略高于高光譜數據,這可能是由于多光譜數據具有較高的空間分辨率,以及高光譜數據在計算J-M距離時采用了所有波段作為輸入,沒有去除冗余波段和低相關波段等的影響。此外,多光譜數據計算的板栗林和其他林地之間的J-M距離僅為0.8491,說明二者之間可分性較差。
4.3分類模型對比
表2為利用多光譜數據的分類混淆矩陣,其OA和Kappa系數分別為85.91%和82%。由表2可知,水體、不透水面及裸土、農田和草地3類的分類精度較高,且農田和草地對應的UA和PA顯著高于高光譜數據。這是由于密云水庫水生態空間范圍多以林地為主,農田和草地的面積小且分布較破碎,增加了樣本選擇的難度。相比之下,多光譜數據的空間分辨率較高,混合像元數量相對較少。本研究中,訓練數據中農田和草地的樣本個數為400,訓練數據中農田和草地的樣本個數為1000。
表2 驗證集分類混淆矩陣
因此,訓練數據的數量和質量影響了分類精度,導致高光譜數據在農田和草地類型上的分類精度顯著低于多光譜數據。但多光譜數據無法區分板栗林和其他林地,使得其他林地的PA僅為61.57%。根據高光譜數據構建的最佳分類特征子集可知,大部分波段集中在短波紅外,而多光譜數據僅有2個短波紅外波段,不足以實現精細樹種分類。因此,上述結果綜合表明高光譜數據不僅可以實現5種地物類型的精細區分,且能夠實現板栗林的可靠識別。最終,密云水庫水生態空間典型地物類型的空間分布如圖4所示。
圖4 密云水庫水生態空間典型地物類型分類結果
五、結論
分析了高光譜數據對于北京市密云水庫水生態空間范圍內典型地物類型的精細識別能力。研究結果表明,高光譜數據可以較好區分水體、林地(其他林地、板栗林)、農田和草地、不透水面及裸地,OA達到0.9361。其中高光譜數據在短波紅外范圍內成功捕捉到了板栗林與其他林地反射特征的區別,實現了二者的區分。但由于空間分辨率較低(30m)且受云覆蓋影響導致板栗林的樣本較少,混合像元數量多,但仍可以實現81.25%的生產者精度和73.03%的用戶精度,因此在提高影像質量(無云影像)和增加樣本量的情況下,高光譜數據可以實現更高精度的板栗林識別。而具有10m空間分辨率的多光譜數據無法實現板栗林的識別,也證明了高光譜數據在樹種分類方面的有效性和優越性。高光譜儀器可在密云水庫水生態空間范圍內實現較為準確的精細地物類型分類,為相關部門提供可靠的基礎數據,并且可結合相關數據實現該地區的水生態空間健康評估(例如根據板栗林的面積等信息評估水土保持情況),為水生態空間的合理規劃和綜合治理提供技術支持。
推薦:
便攜式高光譜成像系統iSpecHyper-VS1000
專門用于公安刑偵、物證鑒定、醫學醫療、精準農業、礦物地質勘探等領域的最新產品,主要優勢具有體積小、幀率高、高光譜分辨率高、高像質等性價比特點采用了透射光柵內推掃原理高光譜成像,系統集成高性能數據采集與分析處理系統,高速USB3.0接口傳輸,全靶面高成像質量光學設計,物鏡接口為標準C-Mount,可根據用戶需求更換物鏡。
審核編輯 黃宇
-
數據
+關注
關注
8文章
7081瀏覽量
89182 -
高光譜
+關注
關注
0文章
334瀏覽量
9961
發布評論請先 登錄
相關推薦
評論