一级片大全,宅男深夜免费必看,亚洲专区一

安全帽佩戴監(jiān)控是鐵路工程施工人員安全管理中的重點和難點，它對檢測算法的準確率與檢測速度都有較高的要求。本文提出一種基于神經(jīng)網(wǎng)絡架構搜索的安全帽佩戴檢測算法 NAS-YOLO。該神經(jīng)網(wǎng)絡架構由上、下行操作單元組成，采用二進制門策略對網(wǎng)絡架構進行更新，通過數(shù)據(jù)驅動的方式自動確定合適的神經(jīng)網(wǎng)絡體系結構。實驗結果表明，NAS-YOLO算法在準確率、召回率及平均檢測速度方面均優(yōu)于實時目標檢測算法 YOLOv3，可以在工程施工中對施工人員安全帽佩戴情況進行實時監(jiān)控。
關鍵詞安全帽佩戴；神經(jīng)網(wǎng)絡架構搜索；自動檢測；檢測算法；實時監(jiān)控

引言
施工現(xiàn)場環(huán)境復雜多變，人群密集，頻繁出現(xiàn)工人不遵守規(guī)章所引發(fā)的傷亡事故，安全帽作為一種常見的防護用具，能夠有效減輕外來危險源對頭部的傷害，因此，實時監(jiān)控施工場所工人安全帽佩戴情況至關重要。然而人工監(jiān)管費時費力，無法滿足安全生產(chǎn)要求。以計算機視覺為技術支撐的智能監(jiān) 控系統(tǒng)有人力成本低、檢測效率高等優(yōu)勢，為自動監(jiān) 測施工現(xiàn)場工人佩戴安全帽情況的方案落地提供了技術方向

1. 安全帽監(jiān)控系統(tǒng)邏輯架構
安全帽監(jiān)控系統(tǒng)的邏輯結構主要分為視頻采集、智能視頻分析和監(jiān)控中心3個模塊，如圖1所示。視頻采集模塊負責通過攝像機進行視頻采集；智能視頻分析模塊是通過算法實現(xiàn)目標檢測、分類，并進行行為和事件檢測，同時還負責對違規(guī)行為發(fā)出報警信息，是安全帽監(jiān)控系統(tǒng)的核心模塊；監(jiān)控中心與監(jiān)控人員直接交互，起到對整個監(jiān)控系統(tǒng)進行監(jiān)視和管理的作用。
安全帽監(jiān)控系統(tǒng)首先由視頻采集模塊獲取視頻數(shù)據(jù)；再由智能視頻分析模塊利用目標檢測技術提取出視頻中的動態(tài)目標，同時進行分類；然后，將分類得到的目標信息與預先設定好的報警準則進行邏輯判斷，如符合預定準則，則智能視頻分析模塊向監(jiān)控中心發(fā)送預警或報警信息；如不符合預定準則，則繼續(xù)進行目標檢測［8］。目標檢測與分類是通過人工智能技術（即深度神經(jīng)網(wǎng)絡）來完成的。與常用的深度神經(jīng)網(wǎng)絡算法不同，這里介紹通過 NAS算法自動搜索合適的神經(jīng)網(wǎng)絡架構。

2.YOLOv3檢測模型
YOLOv3 的主干網(wǎng)絡為 Darkent-53，其中，包含53個卷積層和5個殘差塊，整體網(wǎng)絡結構如圖 2 所示。每個殘差塊包含殘差單元，而殘差單元由DBL組件組成，DBL 組件中包括卷積、批量歸一化和 Leaky reiu激活函數(shù)。殘差單元由DBL通過相加而成，殘差塊由DBL和殘差單元構成，其中，殘差塊借鑒ResNet的思想，增強了特征融合能力。 YOLOv3 通過改變卷積核的步長來實現(xiàn)張量的尺度變換，輸出 3 個不同大小的尺度。

YOLOv3網(wǎng)絡結構

3. NAS算法
NAS 算法是自動機器學習領域的熱點算法之一，可通過數(shù)據(jù)特征自動找到合適的神經(jīng)網(wǎng)絡架構［9］。該算法的原理是光定義搜索空間；然后，通過搜索策略找出候選網(wǎng)絡架構，對候選網(wǎng)絡進行評估；最后，根據(jù)評估結果進行下一輪的搜索。由于 NAS 的根本思想是探索各種潛在的解決方案，搜索空間越大，需要訓練與評估的架構就越多，消耗的資源與時間就越多。因此，搜索空間的設定將直接影響計算開銷。目前 NAS 的主流設計方法為先基于單元（cell）的架構進行設計，再將單元堆疊在主干網(wǎng)絡上，構成整體網(wǎng)絡架構，并由此限制搜索空間大小。換言之，大型網(wǎng)絡是由多個單元組成的，而單元的結構是由整個網(wǎng)絡共享的［10］，因此主干網(wǎng)絡的選擇也十分重要。
目前主流的目標檢測算法是 Fast r-cnn［11］系列算法，首先使用神經(jīng)網(wǎng)絡生成待檢測預選定位框，再對預選定位框進行調整和分類，屬于兩階段算法，雖然精度高，但實時性不強。而YOLO （You Only Look Once）［12］系列的一階段算法采用了回歸的思想，直接在圖像上回歸出預選定位框，同時預測預選定位框所屬類別。YOLO 系列算法的檢測精度雖然略低于 Fast r-cnn 系列，但是運行速度快，能夠很好地完成實時目標檢測任務。另外，還有 SSD （Single Shot MultiBox Detector）［13］算法，結合了回歸思想和預選定位框機制，使得檢測速度和準確率都得到提升。YOLO 系列算法經(jīng)過不斷更新，其中 YOLOv3［14］結合了多種網(wǎng)絡設計技巧，包括了SSD算法中的多尺度特征融合策略［15］，進一步提高了網(wǎng)絡的檢測性能。因此，本文以 YOLOv3 為基礎框架，設計了基于神經(jīng)網(wǎng)絡架構搜索的 YOLO 網(wǎng) 絡，即 NAS-YOLO。 NASYOLO由2種單元架構組成，分別是下行單元和上行單元，并通過基于單元的搜索方式，確定其最終網(wǎng)絡拓撲結構。

3.1 架構搜索方式
對二值化的路徑更新使用了 Cai H 等［20］提出的二進制門方法。這是一種數(shù)據(jù)驅動的方式，具體操作如下。 1）在訓練網(wǎng)絡權重參數(shù)時，先凍結架構參數(shù)，并為每批輸入的數(shù)據(jù)隨機選取二進制門，根據(jù)二進制門得到存活路徑。 2）在訓練數(shù)據(jù)集中，通過標準梯度下降，更新存活路徑的權值參數(shù)。 3）在訓練架構參數(shù)時，先凍結權重參數(shù)，后重置二進制門，更新并驗證數(shù)據(jù)集中的架構參數(shù)。這2個更新步驟以替代方式執(zhí)行，一旦完成架構參數(shù)的訓練，就可以通過修剪冗余路徑來導出緊湊的架構。每次架構參數(shù)的更新只涉及2條路徑，從而將內存需求降低到訓練緊湊模型的相同水平。

3.2 模型訓練
使用安全帽佩戴檢測數(shù)據(jù)集對 NAS-YOLO 算法進行訓練。該數(shù)據(jù)集共有 7 581 張圖像，包含 9 044 個佩戴了安全帽的人像（正樣本），以及 111 514 個普通人像（沒有佩戴安全帽，即負樣本）。隨機選取數(shù)據(jù)集中一半的圖像作為訓練集，另一半作為驗證集，使用二進制門搜索策略對神經(jīng) 網(wǎng)絡架構進行搜索。其中，批量的大小設置為 8，共進行了200期的架構搜索優(yōu)化。網(wǎng) 絡權重訓練中，選用隨機梯度下降（Stochastic Gradient Descent，SGD）優(yōu)化器，動量設置為 0. 95，余弦學習率從 0. 025 衰減到 0. 01，權重衰減為 0. 0003。架構參數(shù) α 的訓練使用 Adam 優(yōu)化器［21］，學習率設置為 0. 0003，重量衰減設置為 0. 0001。使用 1 塊 GeForce RTX 2080ti GPU 對整個架構搜索，大約需要 2 天時間

4. 結果驗證與分析
4.1 算法訓練
YOLOv3和NAS-YOLO訓練過程中的損失函數(shù)曲線（Loss Curve）分別見圖2和圖3。圖中，損失值越小，表示訓練出的模型與數(shù)據(jù)集的真實模型越接近；在2次訓練過程中，網(wǎng)絡損失均保持穩(wěn) 定下降趨勢，YOLOv3在迭代 10 000次左右收斂， NAS-YOLO在迭代 40 000次左右收斂，說明訓練基本順利；與圖2的曲線相比，圖3的曲線收斂于一個更小的值，說明改進后的模型更接近數(shù)據(jù)集的真實模型。

4.2 算法測試
將完成模型訓練NAS-YOLO網(wǎng)絡與現(xiàn)有的目標檢測網(wǎng)絡進行對比，并將幾種算法分別應用于安全帽監(jiān)控系統(tǒng)中，進行安全帽佩戴狀態(tài)的自動識別。隨機選取2名工地管理人員，對視頻中施工人員是否佩戴安全帽進行識別與判斷。一名管理人員先做出判斷，另一名再對其判斷結果進行審查與修正。將2名管理人員的識別判斷結果作為真值，評估 NAS-YOLO 與 SSD、 Fast r-CNN、 YOLOv3 算法的實際應用準確度和運行速度。與其他方法相比，NASYOLO的平均準確率（mean Average Precision，mAP）最高，達 96. 72%；處理速度也最快，檢測速度可達59. 6FPS （Frames Per Second）；但召回率略低于 Fast r-CNN，而 Fast r-CNN 運行速度慢，無法應用于實時的目標檢測任務。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴