技術文章
Technical articles
熱門搜索:
便攜式高光譜相機GaiaField
Gaiasky mini3-VN無人機載高光譜成像系統(tǒng)
高光譜分選儀GaiaSorter
太陽光誘導葉綠素熒光測試系統(tǒng)
“譜像”Image-λ高光譜相機
SpecVIEW高光譜圖像采集及數(shù)據(jù)預處理軟件
高光譜參數(shù)
機載高光譜參數(shù)
成像光譜儀
高光譜數(shù)據(jù)分析軟件SpecSight
供應高光譜相機
偏振成像系統(tǒng)
推掃式機載高光譜成像系統(tǒng)GaiaSky-mini
GaiaMicro-G系列顯微高光譜系統(tǒng)
“凈像”(Pure)系列偏振相機
GaiaSky系列機載高光譜成像系統(tǒng)
更新時間:2026-01-09
點擊次數(shù):64
應用方向
快速、準確且實時地檢測煙草葉片的氮含量對煙葉品質(zhì)監(jiān)測具有重要意義。無人機搭載的高光譜遙感技術可在大尺度上獲取農(nóng)田作物的精細光譜信息。結合多種機器學習算法,可建立高效的葉片氮含量(LNC)評估模型。本研究旨在利用無人機高光譜影像數(shù)據(jù)構建高性能煙草LNC估算模型。為解決單模型性能差異(異質(zhì)性)問題,引入集成學習策略,將多元線性回歸(MLR)、決策樹回歸(DTR)、隨機森林(RF)、自適應提升(Adaboost)及堆疊(Stacking)等多種算法進行融合,以挖掘更多有效數(shù)據(jù)特征。模型性能通過決定系數(shù)(R2)、均方根誤差(RMSE)和平均絕*百分比誤差(MAPE)評估,并以偏最小二乘回歸(PLSR)作為基準。結果表明,所有集成學習模型均優(yōu)于PLSR(R2=0.680,RMSE=5.402 mg/g,MAPE=19.72%),其中基于堆疊策略的模型表現(xiàn)*佳(R2=0.745,RMSE=4.825 mg/g,MAPE=17.98%)。研究為利用無人機高光譜技術實現(xiàn)高效、無損的作物養(yǎng)分與植被表型特征檢測提供了參考。
背景
煙草是中國重要的經(jīng)濟作物,其生產(chǎn)質(zhì)量直接影響農(nóng)民收益與區(qū)域經(jīng)濟發(fā)展。葉片氮含量(LNC)是影響煙葉品質(zhì)的關鍵指標,但傳統(tǒng)檢測方法(人工經(jīng)驗或?qū)嶒炇曳治觯┐嬖诓僮鞣爆崱⒊杀靖?、時效差的問題。無人機(UAV)結合高光譜遙感技術為實現(xiàn)作物氮含量的快速、無損檢測提供了可能,并在水稻、玉米、棉花等作物的葉氮含量估算中取得了成功,但在煙草領域的應用仍然較為有限。盡管高光譜數(shù)據(jù)能夠反映作物的表型特征,但其與葉氮含量之間的關系需要通過精確的建模加以揭示,現(xiàn)有的回歸模型在不同作物和環(huán)境條件下表現(xiàn)異質(zhì),影響預測的穩(wěn)定性和精度。本研究采用三種集成學習方法——隨機森林(RF)、Adaboost回歸和堆疊回歸(stacking),以解決單一模型的局限性,并與傳統(tǒng)的部分最小二乘回歸(PLSR)進行了對比。本研究首*系統(tǒng)評估UAV?HRS用于煙草LNC反演的潛力,并以集成學習緩解不同模型在不同地塊、品種和環(huán)境下的性能異質(zhì)性。

圖1 研究技術路線
實驗與數(shù)據(jù)采集
(1)實驗設置
本研究于2022年在中國云南省大理白族自治州祥云縣和彌渡縣開展,實驗地點位于六個煙草研究農(nóng)田(S1~S6),采用隨機區(qū)組設計,分為三次重復(R1–R3)。每個實驗地塊面積約1000 m2,均為平坦地形,且沒有高壓電線、樹木、建筑物等阻礙無人機飛行的障礙物。煙草苗于四月下旬移栽,隨后每個地塊根據(jù)施肥量(0%、25%、50%、75%、100%、125%、150%)分配了七種肥料處理。
(2)數(shù)據(jù)采集
無人機搭載的高光譜成像平臺包括DJI Matrice 600 Pro無人機和江蘇雙利合譜科技有限公司的GaiaSky-mini2-VN推掃高光譜成像儀,后者在400–1000納米范圍內(nèi)采集了176個波段的高光譜圖像,光譜分辨率為3.5納米。高光譜圖像采集周期為每隔20天(±3天),從移栽后35天開始,持續(xù)到收獲。采集時間段選擇在晴天的10:00到15:00之間,飛行高度為80米,空間分辨率為0.032米。在每次測量前,進行了光譜校準。煙草樣品的采集與高光譜圖像采集同步進行。在每個處理地塊中,從兩株代表性煙草植株的上中部葉片上各采集兩片葉子。樣品被放入標識的紙袋中,并轉(zhuǎn)送至化學實驗室進行分析。
研究結果
(1)預處理高光譜數(shù)據(jù)
本研究通過使用數(shù)據(jù)處理軟件,提取純煙株像元的平均反射率;采用ExG(過量綠色指數(shù))掩膜剔除土壤、陰影與雜草(優(yōu)于NDVI)見圖3。

(a)Raw (b)ExG (c)NDVI
圖2 純煙草像素提取中ExG與NDVI的對比分析。
(2)特征構建:連續(xù)投影算法(SPA)處理
利用SPA(Successive Projection Algorithm)篩選氮敏感波段,該算法不僅能壓縮光譜數(shù)據(jù),還能根據(jù)波長對LNC的貢獻度篩選出有效波段,剔除無意義波長,從而降低模型復雜度,共選出15個關鍵波段(405~959 nm)。
(3)基于Bagging策略的集成學習框架
圖4展示了基于Bagging策略(Bootstrap Aggregating)的集成學習原理。該方法通過對原始訓練集進行多次自助抽樣(Bootstrap sampling),生成若干個隨機子集,在每個子集上分別訓練獨立的弱學習器,最終通過平均或投票融合得到整體預測結果。研究結果表明,RF模型在測試集上獲得R2=0.711、RMSE=5.137 mg/g,顯著優(yōu)于傳統(tǒng)的PLSR模型,驗證了Bagging策略在復雜農(nóng)田環(huán)境下的穩(wěn)健性與抗噪聲能力。

圖3 袋裝法與提升法基本策略比較
(4)主成分分析(PCA)提取主成分貢獻度
研究對400~1000 nm全波段反射率數(shù)據(jù)進行PCA分析后發(fā)現(xiàn),前七個主成分即可累計解釋超過99.9%的光譜信息,如圖5所示。這說明煙草冠層的主要光譜變異可由少量主成分表示,為后續(xù)PLSR建模顯著降低了維度與共線性問題。PCA的引入有效壓縮了數(shù)據(jù)冗余,提升了模型訓練的計算效率和穩(wěn)定性,為構建偏最小二乘回歸(PLSR)及多元線性回歸(MLR)模型提供了優(yōu)化輸入。

圖4 前7個主成分貢獻超過99.9%的信息量
(4)連續(xù)投影算法(SPA)波段特征
使用連續(xù)投影算法(SPA)通過逐步投影和最小化波段間共線性,篩選出*具代表性的光譜特征變量。橫軸為選擇波段數(shù)量,縱軸為模型的RMSE值。結果顯示,當選取波段數(shù)量達到15個時,RMSE下降至約5.1 mg/g,達到*優(yōu)解。進一步增加波段數(shù)量并未顯著降低誤差,表明SPA有效找到了信息量豐富且冗余度低的波段組合。論文指出,SPA能夠在保持主要氮敏感特征的同時減少噪聲干擾,為后續(xù)建模提供更高信噪比的輸入變量,從而提升模型的泛化性能。

圖5 SPA最終篩選的條帶數(shù)量
(5)連續(xù)投影算法(SPA)波段特征選擇
圖7展示了通過SPA算法篩選出的15個關鍵氮敏感波段在400~1000 nm范圍內(nèi)的分布情況。這些波段主要集中于三個關鍵光譜區(qū)間:藍光區(qū)(405–466 nm):對應葉綠素強吸收區(qū),與植被含氮水平密切相關;紅邊區(qū)(662–721 nm):對葉片氮、葉綠素及生理狀態(tài)最敏感;近紅外區(qū)(763–959 nm):反映葉片內(nèi)部結構與水分含量變化。
波段分布均勻且物理意義明確,表明這些波段能全面表征煙草冠層的光譜響應特征。論文指出,該結果驗證了光譜特征與葉片氮含量之間存在穩(wěn)定的函數(shù)關系,為建立穩(wěn)健的高光譜反演模型提供了物理依據(jù)。

圖6 所選15個頻帶的分布表
(6)模型在訓練集與測試集上的預測對比分析
本文比較了不同建模方法在訓練集與測試集上的預測性能,包括PLSR、MLR、DTR、RF、Adaboost以及三種堆疊模型(Stacking-1/2/3),如圖8所示。結果顯示,所有集成學習模型均顯著優(yōu)于基線PLSR模型(R2=0.680)。其中,Stacking-3模型在測試集上表現(xiàn)*佳(R2=0.745,RMSE=4.824 mg/g,MAPE=17.98%),兼具高精度與高穩(wěn)定性。Adaboost模型在MAPE上表現(xiàn)*優(yōu)(17.56%),說明其通過動態(tài)調(diào)整弱學習器權重有效降低了偏差。整體趨勢表明,Stacking策略可整合不同模型的優(yōu)點,提取更多潛在特征信息,從而提高對煙草葉片氮含量的預測能力。這一結果證實了集成學習框架在應對高維非線性農(nóng)業(yè)遙感數(shù)據(jù)時的優(yōu)勢。

圖7 不同模型下訓練集與測試集的煙草煙霧密度(mg/g),??2與RMSE的對比分析
(7)討論模型在不同數(shù)據(jù)集和堆疊層級下的表現(xiàn)差異
不同子集達到AVCR>99.9%所需的主成分數(shù)不同——S1~S3:5;S4:8;S5:6;S6:6。這表明各子集的“有效信息維度"并不一致,反映了品種、環(huán)境與背景噪聲導致的譜—氮關系復雜度差異。復雜度越高(如S4需8個PC),越難以用統(tǒng)一線性子集精確刻畫。

圖8 子集S1~S3、S4、S5和S6的AVCR值
橫向?qū)Ρ雀鱾€子集:S6(*佳):測試集 R2=0.703,RMSE=5.315 mg/g,MAPE=16.30%;S4(最差):測試集 R2=0.462,RMSE=6.122 mg/g,MAPE=17.86%。
在樣本量較小的子集(S4、S5、S6),PLSR的過擬合傾向更明顯,而樣本量相對較大的S1~S3穩(wěn)定性更好,指出樣本量與參數(shù)充分訓練對穩(wěn)定性的關鍵作用。

圖9 PLSR在各子集的泛化差異比較
結論
本文基于UAV搭載高光譜(400~1000?nm)與田間實測數(shù)據(jù),采用PCA+SPA兩級降維并系統(tǒng)比較PLSR與多種集成學習策略,結論表明:在跨地區(qū)、跨品種、跨環(huán)境的混合數(shù)據(jù)下,集成學習整體顯著優(yōu)于PLSR,其中堆疊(Stacking)在精度與穩(wěn)健性上*優(yōu);*佳模型SPA?Stacking?3在測試集達到R2≈0.745、RMSE≈4.82?mg/g、MAPE≈17.98%,而且基學習器應“準確且異質(zhì)",二層元學習器宜取簡單線性模型以抑制過擬合;SPA能有效降低光譜冗余、基本不損失關鍵信息。盡管UAV?HRS的定量精度尚低于近地觀測,但其提供連續(xù)空間信息、適于規(guī)模化表型監(jiān)測,具備用于煙草氮素與相關性狀快速、無損監(jiān)測的應用潛力;后續(xù)應進一步提升影像與預處理質(zhì)量、拓展基學習器譜系,并開展分生育期/分區(qū)建模以增強普適性與可靠性。