幾個世紀以來,科學家們建立和維護著巨大的植物信息庫,遍布全球的自然歷史博物館和研究機構中有著成千上萬的植物標本。科學家們利用這些標本對新發現的植物進行識別和分類。近年來隨著標本的數字化,文本、數據和圖像變得更易分享和獲取。
如今來自史密斯學會和哥斯達黎加理工學院的研究人員們正致力于更加充分地深入利用這些數據,將大數據分析、計算機數據和GPU計算技術結合起來,希望更深入地理解植物信息學。
在深度學習幫助下,科學家們有望大大加速每年的植物分類學工作效率,傳統的人工分類條件下植物學家需要對新發現的物種與已知的40萬種植物作比較,每年能發現并描述2000種植物。
哥斯達黎加理工的研究人員與法國國家農業研究中心和法國國家信息與自動化研究所合作研發出了一種基于圖像識別的深度學習算法。他們基于博物館的標本數據庫訓練了一個能根據圖像數據對植物進行分類的分類器。
研究人員們用InceptionNet改進了新的模型,將Relu單元變為參數化的ReLU單元用于避免了模型了過擬合。同時在單元中增加了批量歸一化單元。用于加速網絡的訓練收斂。在使用中每一個batch有16張224*224的圖片作為輸入,并以0.0075的學習率進行訓練。
訓練數據來自于標本數據和一系列真實樣本數據包括包含214種植物的Herbarium255 數據庫,包含一千種植物的PlantCLEF數據庫,255種葉片數據的CRleaves數據庫。通過這些數據庫的訓練,研究人員們達到了90%的識別分類準確率,將傳統需要人工識別比對的工作效率大大提了。
同時史密斯學會也進行了獨立的研究,利用卷積神經網絡對自然歷史信息進行數字化處理,利用深度神經網絡對基于圖像的植物標本信息進行處理,同時也實現了90%的精度,同時可以以96%的精度區分形態學上極為相似的兩種植物。
這對于植物分類學的意義重大,意味著植物學家們可以中耗時最多的比對分類工作中解放出來,迅速提高植物分類學的研究效率,將大大增加每年新發現的植物種類,推動一個新的大發現的時代到來。同時準確的植物分類結果是確定生物種群分布的基礎,著更有助于保護區的劃建和對動植物的保護。
與此同時史密斯學會還致力于對水銀處理的追蹤,這是一種早期植物學家處理植物標本防止昆蟲損壞的方式。通過掃面上萬張沾染和非沾染汞的植物樣本照片,使得植物學家們可以分離出被汞處理過的樣本。
法國農業研究發展中心隨后研發出了一個稱為PPl@ntNet的神經網絡并繼承到了手機app中,使的人們可以更加方便的在考察中使用手機快速的對植物進行分類采集需要的數據,而不用像以前一樣采集標本送回實驗時進行漫長的比對才能確定結果。
一個小游戲:識別你家的花盆里的植物是啥>>https://identify.plantnet-project.org/
和上述工作類似的是,史密斯學會建立并維護的iDigiBio數據庫,這是一個龐大的數據化生物信息庫,包括生物分布和圖像數據以及形態學生物學方面的信息。在未來將逐漸將深度學習應用在這一數據庫上發揮更大的價值。
目前哥斯達黎加理工的團隊希望在兩個方面繼續深化這種高效率的生物信息學。首先他們希望在更多的物種上建立起識別的生物信息庫,將這種識別方式應用到昆蟲、鳥類和魚類等物種的發現鑒別和分類中去。另一方面,他們希望在縱深方向進行更深入的發展,實現從基因層面到種屬方面的自頂向下的全面分類信息。這將會實現全新的生物信息學并涵蓋更為豐富的信息,達到更高程度的信息融合.
-
AI
+關注
關注
87文章
31087瀏覽量
269414 -
深度學習
+關注
關注
73文章
5507瀏覽量
121266
原文標題:AI與植物學:深度學習助力科學對植物生物多樣性的理解,帶你走進神奇的植物世界
文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論