應(yīng)用方向:
在本研究中,高光譜成像技術(shù)被應(yīng)用于茶樹扦插苗的生長監(jiān)測與建模,展現(xiàn)出在農(nóng)業(yè)育種與智能管理中的廣闊應(yīng)用前景。通過對葉片和嫩梢的高光譜反射數(shù)據(jù)采集,結(jié)合深度學(xué)習(xí)可以在不破壞樣本的前提下實(shí)現(xiàn)茶苗地上部和根系生物量的快速、精準(zhǔn)預(yù)測,解決根系難以直接測量的問題,為替代傳統(tǒng)耗時(shí)且破壞性的稱重方法提供了有效途徑。因此,高光譜技術(shù)不僅能夠?yàn)椴铇鋬?yōu)良品種的篩選和扦插苗的生長監(jiān)測提供可靠手段,還可為苗圃精細(xì)化管理和智能化育苗奠定技術(shù)基礎(chǔ)。
背景:
茶樹是全球重要的經(jīng)濟(jì)作物,具有龐大的消費(fèi)市場,但茶苗的繁育與生長受到**氣候條件等因素的限制,導(dǎo)致茶樹扦插苗生長緩慢、成本高昂,從而制約了優(yōu)良品種的推廣與產(chǎn)業(yè)化水平。扦插苗的地上部和根系生物量是衡量其生長發(fā)育質(zhì)量的重要指標(biāo),因此,如何快速、準(zhǔn)確地監(jiān)測其生長過程對于提高成活率和苗木管理水平具有重要意義。
傳統(tǒng)的人工稱重方法在測定茶樹扦插苗生物量時(shí)具有破壞性且效率低,難以滿足高通量、無損檢測的需求。近年來,高光譜成像技術(shù)因其能夠同時(shí)獲取樣品的結(jié)構(gòu)和化學(xué)信息,被廣泛應(yīng)用于作物性狀監(jiān)測。已有研究表明,光譜信息與植物的生理、生化特征存在緊密聯(lián)系,可用于反映植株的養(yǎng)分含量、**水平及生理狀態(tài)。結(jié)合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法,能夠進(jìn)一步提升高光譜數(shù)據(jù)的建模精度與穩(wěn)定性。
因此,該研究提出利用高光譜成像技術(shù)結(jié)合深度學(xué)習(xí)方法,對茶樹扦插苗的地上部和根系生物量進(jìn)行快速、無損預(yù)測,以解決傳統(tǒng)方法耗時(shí)、破壞性強(qiáng)的問題,為茶樹優(yōu)良品種的高效篩選和精細(xì)化育苗管理提供新的技術(shù)途徑和數(shù)據(jù)支撐。
作者信息:丁兆堂;山東省農(nóng)業(yè)科學(xué)院
期刊來源:Scientia Horticulturae
研究內(nèi)容
本研究旨在利用高光譜成像技術(shù)結(jié)合深度學(xué)習(xí)模型,實(shí)現(xiàn)對茶樹扦插苗地上部和根系生物量的快速、無損與精準(zhǔn)預(yù)測,以解決傳統(tǒng)人工稱重方法破壞性強(qiáng)、效率低的問題。研究過程中,首先采集不同生長階段茶樹扦插苗葉片與嫩梢的高光譜反射數(shù)據(jù),并對光譜數(shù)據(jù)進(jìn)行預(yù)處理,以去除噪聲和散射效應(yīng)并增強(qiáng)光譜與生理指標(biāo)的相關(guān)性。隨后,提取關(guān)鍵光譜特征波段,減少冗余信息并突出與生物量密切相關(guān)的變量。在建模環(huán)節(jié),利用 Mask R-CNN 網(wǎng)絡(luò)對扦插苗進(jìn)行圖像與光譜特征融合,構(gòu)建CNN-GRU生物量預(yù)測模型。研究建立了一種高效可靠的檢測方法,為茶樹優(yōu)良品種的篩選、扦插苗的生長監(jiān)測以及智能化育苗管理提供了新的技術(shù)途徑與數(shù)據(jù)支撐。
實(shí)驗(yàn)設(shè)計(jì)
茶樹扦插苗選用了三個(gè)品種:‘玉金香(YJX)’、‘中白1號(ZB)’和‘中茗6號(ZM)’。為了獲取不同生長期的茶扦插苗,實(shí)驗(yàn)每25天進(jìn)行一次,共進(jìn)行了10次。每次試驗(yàn)1個(gè)穴盤(含32株扦插苗),共收獲扦插苗960株(3個(gè)品種× 32株扦插苗× 10個(gè)試驗(yàn))。
為了測定扦插苗的生長情況,對960條扦插苗的枝條和根系進(jìn)行破壞性分析,并采集高光譜數(shù)據(jù),將枝條和根系置于105 ℃烘箱中20 min,然后將烘箱溫度調(diào)至90 ℃干燥至恒重,*后用電子秤記錄重量
本研究采用了高光譜成像技術(shù)來監(jiān)測茶扦插苗從扦插到成長為幼苗過程中生物量的變化(見圖1a)。高光譜成像采集系統(tǒng)包括成像光譜相機(jī)(Gaia field pro-v10,江蘇雙利合譜技術(shù)有限公司),四個(gè)鹵素?zé)?、電腦、校正白板、黑色背景。高光譜相機(jī)所拍攝圖像的光譜范圍在可見-近紅外波段(391-1010 nm),光譜范圍為1101 × 960像素,可測量360個(gè)波段的光譜反射率。為了避免光譜相機(jī)內(nèi)部暗電流的影響,提高高光譜圖像的信噪比,對獲取的原始高光譜圖像進(jìn)行黑白白色校正。利用高光譜相機(jī)采集了960株扦插苗的高光譜數(shù)據(jù),每幅高光譜圖像包含8株扦插苗作為一個(gè)模型樣本,得到包括120個(gè)高光譜圖像的總數(shù)據(jù)集。通過結(jié)合成熟葉片和莖葉的光譜信息以及深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算法,對莖葉和根系的生物量進(jìn)行了評估(見圖1b)。
圖1. 圖像采集與流程圖的結(jié)合。(a) 圖像采集 (b) 數(shù)據(jù)處理流程圖
研究方法
為了增加模型訓(xùn)練的數(shù)據(jù)量,120張圖像通過兩種不同的數(shù)據(jù)增強(qiáng)方法進(jìn)行處理:旋轉(zhuǎn)(90°、180°和270°)和翻轉(zhuǎn)(水平和垂直),圖像數(shù)量增加到720張。這些圖像通過Labelme軟件進(jìn)行手動標(biāo)注。首先,對成熟葉片和莖葉區(qū)域分別用不同顏色的標(biāo)簽進(jìn)行標(biāo)注和分類,其中綠色代表莖葉,紅色代表成熟葉片。未標(biāo)注的區(qū)域被視為背景。圖2展示了成熟葉片和莖葉的標(biāo)注圖像。隨后,將這些標(biāo)注圖像輸入到Mask R-CNN中進(jìn)行訓(xùn)練。
圖2. 標(biāo)注圖像 (a) 標(biāo)注成熟葉片和莖葉的圖像;(b) 標(biāo)注完成的成熟葉片和莖葉圖像
Mask R-CNN網(wǎng)絡(luò)被用于獲取莖葉和成熟葉片的面積。圖3展示了Mask R-CNN網(wǎng)絡(luò)的結(jié)構(gòu)圖。Mask R-CNN 網(wǎng)絡(luò)主要分為五個(gè)結(jié)構(gòu):Backbone、區(qū)域建議網(wǎng)絡(luò)(RPN)、感興趣區(qū)域?qū)R(ROI Align)、邊框回歸(Box Regression)以及分類與掩膜(Classification and Mask)。通過5折交叉驗(yàn)證將標(biāo)記的圖像劃分為訓(xùn)練集和測試集。所采用的學(xué)習(xí)率為0.001,Epoch為20,Batch大小為1。
圖3. Mask R-CNN的結(jié)構(gòu)圖。
由于高光譜采集儀器及環(huán)境因素的影響,在成熟葉片和嫩梢的光譜中存在散射效應(yīng)、隨機(jī)噪聲和系統(tǒng)噪聲。因此,本研究對其光譜數(shù)據(jù)進(jìn)行了 MSC、S-G 和一階導(dǎo)數(shù)(1-D)預(yù)處理。另外為了減少數(shù)據(jù)計(jì)算量并提高后續(xù)建模的準(zhǔn)確性,本研究采用了連續(xù)投影算法(SPA)、競爭自適應(yīng)重加權(quán)采樣算法(CARS)和不確定性變量消除算法(UVE)來選擇具有代表性的光譜波段作為特征波段。
在模型的建立方面,構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)與門控循環(huán)單元(CNN-GRU)網(wǎng)絡(luò)模型和傳統(tǒng)機(jī)器學(xué)習(xí)模型。CNN-GRU模型網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。首先,為了更好地提取數(shù)據(jù)的底層特征,使用CNN來提取數(shù)據(jù)特征。然后,數(shù)據(jù)被輸入到一個(gè)5×5的濾波器中進(jìn)行卷積。經(jīng)過4次卷積、平均池化、序列擴(kuò)展和展平后,數(shù)據(jù)被輸入到GRU網(wǎng)絡(luò)中。在這里,一維光譜數(shù)據(jù)與莖葉和根系生物量數(shù)據(jù)被GRU網(wǎng)絡(luò)結(jié)合,用于回歸預(yù)測。此外,在CNN網(wǎng)絡(luò)中,步長為1,填充為“same”(填充值由算法根據(jù)卷積核大小內(nèi)部計(jì)算),輸入數(shù)據(jù)通道為1。經(jīng)過3次門控循環(huán)后,預(yù)測數(shù)據(jù)被輸入到全連接層,并通過回歸器輸出。
圖4. CNN-GRU的結(jié)構(gòu)圖。
為了進(jìn)一步驗(yàn)證CNN-GRU網(wǎng)絡(luò)的性能,使用了SVR、RFR和PLSR三種機(jī)器學(xué)習(xí)方法和CNN、LSTM兩種深度學(xué)習(xí)方法作為對比模型,CNN和LSTM網(wǎng)絡(luò)的層數(shù)均設(shè)置為16層。為了防止模型的過擬合,在訓(xùn)練過程中確定了超參數(shù),支持向量回歸機(jī)的核函數(shù)為多項(xiàng)式核函數(shù),RFR的樹的數(shù)量為200,PLSR的隱變量為18。在本研究中,用6種方法分別建立了以地上部、成熟葉和地上部、根系生物量為指標(biāo)的回歸模型。
為了進(jìn)一步保證算法的準(zhǔn)確性,本研究采用五重交叉驗(yàn)證,將數(shù)據(jù)集分成五部分,依次取其中4個(gè)作為訓(xùn)練數(shù)據(jù),1個(gè)作為測試數(shù)據(jù),重復(fù)五次,然后對結(jié)果進(jìn)行平均,為了更準(zhǔn)確地評價(jià)回歸模型的性能,使用決定系數(shù)(R2)、均方根誤差(RMSE)、歸一化均方根誤差(NRMSE)和相對百分比偏差(RPD)來評價(jià)模型的性能。為了評估Mask R-CNN模型的光譜信息提取性能,使用精度,召回率和F1得分來評估模型的性能。
結(jié)果
通過實(shí)驗(yàn)室方法測定了茶扦插苗的莖葉和根系生物量。結(jié)果顯示,三種品種的扦插苗莖葉萌發(fā)時(shí)間相同,均在第25天開始萌發(fā)。然而,中茗6號(ZM)的生根時(shí)間*早,從第125天開始生根;中茗6號的莖葉和根系生長量*大,莖葉生長量約為1.7克,根系生長量約為0.6克。在200–225天期間,莖葉和根系的生長速度*快;中白1號(ZB)的生根時(shí)間*晚,從第175天開始生根;玉金香(YJX)的莖葉和根系生長量*小,莖葉生長量約為0.8克,根系生長量約為0.1克。
對成熟葉片和莖葉的分割結(jié)果進(jìn)行了比較和分析,結(jié)果顯示,Mask R-CNN能夠以高精度分割成熟葉片和莖葉。其中,成熟葉片光譜的提取效果優(yōu)于莖葉光譜,提取精度達(dá)到97.8%。莖葉光譜的提取精度為91.5%。成熟葉片和莖葉光譜的提取精度均超過90%。因此,Mask R-CNN模型能夠準(zhǔn)確且高效地從茶扦插苗圖像中提取成熟葉片和莖葉的光譜信息。
對Mask R-CNN模型提取的成熟葉片和枝條原始光譜分別采用MSC、1-D和S-G算法進(jìn)行預(yù)處理,如圖5所示,與原始光譜相比,MSC、1-D和S-G聯(lián)合預(yù)處理后光譜曲線的波峰和波谷更加突出,提高了光譜的分辨率和靈敏度,有利于提高后期建立回歸模型的準(zhǔn)確性。
圖5. 原始光譜與MSC、1D和S-G預(yù)處理后的光譜對比。(a) 莖葉光譜 + 莖葉生物量;(b) 莖葉光譜 + 根系生物量;(c) 成熟葉片光譜 + 莖葉生物量;(d) 成熟葉片光譜 + 根系生物量。
為了消除無關(guān)波段對模型準(zhǔn)確性的影響,在基于莖葉光譜選擇莖葉生物量特征波段的方法中,UVE選擇的特征波段數(shù)量*多,達(dá)到212個(gè)波長,而SPA選擇的特征波段數(shù)量*少,僅為8個(gè)波長;在基于莖葉光譜選擇根系生物量特征波段的方法中,UVE選擇的特征波段數(shù)量*多,為135個(gè)波長,SPA選擇的特征波段數(shù)量*少,為6個(gè)波長;在基于成熟葉片光譜選擇莖葉生物量特征波段的方法中,UVE選擇的特征波段數(shù)量*多,為69個(gè)波長,SPA選擇的特征波段數(shù)量*少,為14個(gè)波長;在基于成熟葉片光譜選擇根系生物量特征波段的方法中,UVE選擇的特征波段數(shù)量*多,為90個(gè)波長,SPA選擇的特征波段數(shù)量*少,為17個(gè)波長。
在基于莖葉光譜評估莖葉生物量時(shí),UVE算法的建模效果優(yōu)于CARS和SPA,UVE+CNN-GRU提供了*佳的估算模型(Rp2=0.90,RMSEP=0.12,RPD=2.43)。CARS算法的建模效果較差,CARS+PLSR模型的效果*差(Rp2=0.50,RMSEP=0.32,RPD=1.36)。
在基于成熟葉片光譜評估莖葉生物量時(shí),UVE算法的建模效果優(yōu)于CARS和SPA,UVE+CNN-GRU提供了*佳的估算模型(Rp2=0.78,RMSEP=0.16,RPD=2.13)。SPA算法的建模效果較差,SPA+PLSR模型的效果*差(Rp2=0.48,RMSEP=0.29,RPD=1.00)。在基于成熟葉片光譜評估根系生物量時(shí),SPA算法的建模效果優(yōu)于UVE和CARS,SPA+LSTM提供了*佳的估算模型(Rp2=0.65,RMSEP=0.05,RPD=1.67)。CARS算法的建模效果較差,CARS+PLSR模型的效果*差(Rp2=0.39,RMSEP=0.10,RPD=1.22)。圖6展示了四種*佳估算模型的預(yù)測值與實(shí)際值的散點(diǎn)圖。
圖6. 四種*佳估算模型的預(yù)測值與實(shí)際值的散點(diǎn)圖。(a) 莖葉光譜 + UVE + CNN-GRU;(b) 成熟葉片光譜 + UVE + CNN-GRU;(c) 莖葉光譜 + SPA + CNN;(d) 成熟葉片光譜 + SPA + LSTM。
結(jié)論
本研究提出了一種利用高光譜成像技術(shù)監(jiān)測茶扦插苗莖葉生長和根系生長的方法。首先,通過Mask R-CNN提取茶扦插苗成熟葉片的光譜和莖葉的光譜。隨后,利用MSC、S-G濾波和1-D對光譜進(jìn)行預(yù)處理,并通過UVE、CARS和SPA篩選特征波段。*后,采用CNN-GRU網(wǎng)絡(luò)構(gòu)建莖葉和根系生物量的預(yù)測模型。研究結(jié)果表明:(1)Mask R-CNN能**提取成熟葉片(**率=97.8%)和嫩梢(**率=91.5%)的光譜特征;(2)通過UVE方法篩選獲得的嫩梢(212個(gè))和根系(105個(gè))生物量特征波段,較CARS和SPA方法更具豐富性;(3)基于嫩梢光譜構(gòu)建的UVE+CNN-GRU模型(Rp2=0.90,RMSEP=0.12,RPD=2.43)對嫩梢生物量的估算效果*優(yōu),表明該模型預(yù)測結(jié)果可靠,與實(shí)際值誤差較??;(4)基于成熟葉片光譜構(gòu)建的SPA+LSTM模型(Rp2=0.65,RMSEP=0.05,RPD=1.67)對根系生物量的估算效果*佳,證明該模型可用于茶樹扦插苗根系狀況評估,為根系生長監(jiān)測提供了有效手段。