色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

模擬使軟件工程師能夠生成訓練神經網絡所需的數據

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Peter McGuinness ? 2022-07-09 07:45 ? 次閱讀

在多年前,當多倫多大學的一個團隊使用經過訓練而不是設計來識別圖像的卷積神經網絡贏得 Imagenet 挑戰賽時,在計算世界的一個有點不起眼的角落發生了重大震動。該團隊和其他團隊不僅擊敗了最好的檢測算法,而且在許多圖像分類任務中都超越了人類。現在,僅僅幾年后,深度神經網絡似乎是不可避免的。

即使在2012年,機器學習也不是什么新鮮事物,事實上,到目前為止,幾乎所有的分類軟件都進行了一些訓練。但它們在某種程度上都依賴于人工設計的特征提取算法。這個新解決方案(后來以首席研究員的名字命名為 AlexNet)的不同之處在于,它沒有這種人工設計的算法,并且完全通過監督學習獲得了結果。

這一發現對整個計算領域的影響已經在與圖像分類相距甚遠的領域產生了巨大的影響,隨著研究人員學習如何將深度學習技術應用于更多領域,預計它帶來的變化在未來會更加深遠。以及越來越多的領域中的更多問題。對深度學習的熱情甚至導致一些評論員預測依賴于設計算法的經典軟件創作的終結,取而代之的是經過大量數據訓練的網絡

軟件解決方案從數據暴露演變的愿景有一些引人注目的方面:通過實例進行培訓為軟件提供了真正的大規模制造技術的可能性。目前,軟件制造處于工業化前階段,每個應用程序都是定制設計的,就像客車制造的汽車一樣。借助標準算法平臺(網絡)和自動化培訓環境,深度學習可以為軟件做亨利福特為汽車制造所做的事情。

無論您是否同意這一愿景,深度學習的關鍵特征在于它取決于數據的可用性,因此,特定領域的專業知識變得不如相關數據的所有權重要。正如深度學習先驅 Andrew Ng 所說:“獲勝的不是擁有最好算法的人,而是擁有最多數據的人。” 這是希望過渡到新范式的公司面臨的核心問題:他們從哪里獲取數據?

行為數據的作用

對于依賴在線行為數據的公司來說,答案是顯而易見的,我們所有瀏覽習慣的記錄、跟蹤和轉售現在無處不在,以至于它們的開銷都支配了我們的在線體驗。對于與現實世界打交道更密切的公司來說,解決方案不太方便。Waymo 是自動駕駛汽車領域最知名品牌,它通過部署儀表汽車車隊來繪制位置圖并記錄現實世界的攝像頭、雷達和其他數據,然后將這些數據輸入其感知軟件,從而解決了這個問題。該領域的其他參與者也以較小的方式效仿,但即使是擁有數百萬英里行駛里程和大量可用數據的 Waymo,也發現它不足以完成這項任務。

首先,并非所有數據都是平等的:為了有用,它必須經過準確和徹底的注釋,即使在今天,這仍然是一項昂貴且容易出錯的業務。經過幾年努力使流程自動化,亞馬遜的 Mechanical Turk 仍然是注釋數據的首選方法。除了被注釋之外,為了有用,數據必須是相關的,當相關性取決于任何給定事件的不常見、危險或完全非法時,這是一個主要問題。可靠、相關的真實數據很難獲得,以至于 Waymo 已經開始在沙漠中建立自己的模擬城市,在那里它可以模擬在受控條件下所需的行為。

但是在好萊塢可以制作完全令人信服的 CGI 場景的世界中,必須有可能使用這種能力為現實世界場景創建訓練數據,當然,確實如此。幾年來,該行業一直在朝著這個方向發展,一個研究人員團隊開發了一種方法來注釋俠盜獵車手的序列。Udacity 有一個用于自動駕駛汽車模擬器的開源項目,作為其自動駕駛汽車納米學位的一部分。

與 Udacity 示例一樣,大多數可用的模擬器旨在實現驗證循環以測試經過訓練的感知堆棧,而不是生成主要用于訓練本身的數據。那些確實存在的數據模擬器被汽車公司及其初創競爭對手緊緊抓住,展示了他們產生的數據的基本價值。

那么,合成數據真的可以成功地用于訓練神經網絡嗎?需要多少和什么樣的數據才能完成這項工作?

什么是 KITTI

總部位于帕洛阿爾托的Highwai發布了其試點研究的結果,該研究使用 KITTI 數據集作為起點,以檢查用于增強 KITTI 提供的注釋圖像的完全合成數據集可能獲得的收益。

訓練圖像是使用 Highwai 的真實世界模擬器制作的,其中包括從市區和住宅郊區場景拍攝的許多序列,這些場景中擠滿了各種車輛、行人和自行車。目的是對象檢測和分類,而不是跟蹤,因此將捕獲幀速率設置為較低,以便在保持數據集大小適中的同時捕獲各種圖像。圖像是在一系列條件下拍攝的,包括相機高度和視野、由于一天中的時間和大氣影響(如霧和霾)引起的照明和陰影變化。雖然 Highwai 的工具支持 LIDAR,但在這種情況下只捕獲了可見光相機數據。注釋包括諸如“行人、

使用 Highwai 的數據增強工具包為訓練準備數據,以添加相機傳感器噪聲、圖像壓縮噪聲、向圖像添加“干擾”對象并使訓練對顏色不敏感。在此過程結束時,合成數據集的總大小為 5,000 張圖像中的 54,443 個對象。(相比之下,原始 KITTI 數據集中有 37,164 個對象和 7,000 個圖像)。生成數據、擴充數據并將其添加到訓練數據集的總時間不到兩個小時。

使用的基礎網絡是一個 Faster RCNN Inception Resnet,它被預訓練為上下文中常見對象 (COCO) 數據集上的對象檢測器,并進行了兩次補充重新訓練;首先僅使用 KITTI 數據集生成基線,然后結合 KITTI 和 Highwai 合成數據集。測試是在 KITTI 參考測試數據集上完成的,該數據集僅包含真實世界的圖像,并且在僅 KITTI 和 KITTI 加合成訓練之間顯示出顯著的性能提升。添加合成數據后,識別率總體提高了 5.9%,對汽車和行人的檢測顯著提高——這一結果并不令人驚訝,因為 Highwai 合成數據集集中在這些對象類型上。

需要多少訓練數據的問題沒有很好的答案,但 Highwai 指出高度針對性的數據管理對于將其保持在合理范圍內至關重要。一個很好的例子是他們為一個未公開的對象檢測項目創建的數據集,其中實際用于訓練的圖像和注釋數據總量約為 15GB。最初的大約 12,000 張圖像包含大約 120,000 個帶注釋的對象,是從 30,000 個圖像和 500,000 個帶注釋的對象的原始集合中自動整理出來的。

像這樣的結果對于獨立軟件制造商以及系統集成商和 OEM 來說都很重要。當然,他們可以使用亞馬遜的服務來幫助訓練網絡,但如果價值在于數據,那么商業可行性要求他們能夠在該領域創建 IP——他們必須能夠使用自己的領域專業知識創建自己的訓練數據來指定、優化和管理數據集。這意味著旨在生產此類 IP 的工具行業的出現是重要的一步,將受到歡迎。我們可以期待看到使用合成訓練數據的專業知識的快速發展,以及生產它的工具的同樣快速發展。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4774

    瀏覽量

    100898
  • 模擬器
    +關注

    關注

    2

    文章

    879

    瀏覽量

    43276
  • 機器學習
    +關注

    關注

    66

    文章

    8425

    瀏覽量

    132771
收藏 人收藏

    評論

    相關推薦

    LSTM神經網絡訓練數據準備方法

    LSTM(Long Short-Term Memory,長短期記憶)神經網絡訓練數據準備方法是一個關鍵步驟,它直接影響到模型的性能和效果。以下是一些關于LSTM神經網絡
    的頭像 發表于 11-13 10:08 ?695次閱讀

    關于卷積神經網絡,這些概念你厘清了么~

    要的部分,它們使用一組獨特的權重和濾波器,使得網絡可以從輸入數據中提取特征。數據可以是許多不同的形式,如圖像、音頻和文本。這種提取特征的過程使CNN
    發表于 10-24 13:56

    如何使用經過訓練神經網絡模型

    使用經過訓練神經網絡模型是一個涉及多個步驟的過程,包括數據準備、模型加載、預測執行以及后續優化等。
    的頭像 發表于 07-12 11:43 ?1049次閱讀

    脈沖神經網絡怎么訓練

    脈沖神經網絡(SNN, Spiking Neural Network)的訓練是一個復雜但充滿挑戰的過程,它模擬了生物神經元通過脈沖(或稱為尖峰)進行信息傳遞的方式。以下是對脈沖
    的頭像 發表于 07-12 10:13 ?652次閱讀

    20個數據可以訓練神經網絡

    當然可以,20個數據點對于訓練一個神經網絡來說可能非常有限,但這并不意味著它們不能用于訓練。實際上,神經網絡可以
    的頭像 發表于 07-11 10:29 ?960次閱讀

    怎么對神經網絡重新訓練

    重新訓練神經網絡是一個復雜的過程,涉及到多個步驟和考慮因素。 引言 神經網絡是一種強大的機器學習模型,廣泛應用于圖像識別、自然語言處理、語音識別等領域。然而,隨著時間的推移,數據分布可
    的頭像 發表于 07-11 10:25 ?474次閱讀

    如何利用Matlab進行神經網絡訓練

    Matlab作為一款強大的數學計算軟件,廣泛應用于科學計算、數據分析、算法開發等領域。其中,Matlab的神經網絡工具箱(Neural Network Toolbox)為用戶提供了豐富的函數和工具
    的頭像 發表于 07-08 18:26 ?1930次閱讀

    rnn是遞歸神經網絡還是循環神經網絡

    RNN(Recurrent Neural Network)是循環神經網絡,而非遞歸神經網絡。循環神經網絡是一種具有時間序列特性的神經網絡能夠
    的頭像 發表于 07-05 09:52 ?595次閱讀

    人工神經網絡模型訓練的基本原理

    圖像識別、語音識別、自然語言處理等。本文將介紹人工神經網絡模型訓練的基本原理。 1. 神經網絡的基本概念 1.1 神經神經元是
    的頭像 發表于 07-05 09:16 ?705次閱讀

    卷積神經網絡訓練的是什么

    訓練過程以及應用場景。 1. 卷積神經網絡的基本概念 1.1 卷積神經網絡的定義 卷積神經網絡是一種前饋深度學習模型,其核心思想是利用卷積操作提取輸入
    的頭像 發表于 07-03 09:15 ?440次閱讀

    如何訓練和優化神經網絡

    神經網絡是人工智能領域的重要分支,廣泛應用于圖像識別、自然語言處理、語音識別等多個領域。然而,要使神經網絡在實際應用中取得良好效果,必須進行有效的訓練和優化。本文將從神經網絡
    的頭像 發表于 07-01 14:14 ?489次閱讀

    嵌入式軟件工程師如何提升自己?

    的基礎 嵌入式軟件工程師需要具備扎實的計算機科學和工程知識。因此,在職業生涯的起步階段,建議將重點放在學習基礎知識上,包括數據結構、算法、操作系統、編程語言等。通過深入學習這些基礎知識,打下堅實的理論基礎,為將來
    發表于 06-12 11:20

    嵌入式軟件工程師和硬件工程師的區別?

    部分,如微處理器、傳感器、執行器等。他們的任務是創建硬件平臺,以滿足軟件工程師的需求,提供必要的硬件功能和性能。 定義和工作職責 嵌入式硬件工程師的主要職責是設計、制造、測試和部署嵌入式系統所需的硬件
    發表于 05-16 11:00

    助聽器降噪神經網絡模型

    在堆棧網絡方法中,參數少于一百萬個。該模型使用挑戰組織者提供的 500 小時的嘈雜語音進行訓練。 該網絡能夠進行實時處理(一幀輸入,一幀輸 出)并達到有競爭力的結果。將這兩種類型的信號
    發表于 05-11 17:15

    利用神經網絡對腦電圖(EEG)降噪

    數據與干凈的EEG數據構成訓練數據,并且分成訓練、驗證和測試數據集。 繪制有噪聲EEG
    發表于 04-30 20:40
    主站蜘蛛池模板: 四房播播最新地址| 亚洲这里只有精品| 国产伦精品一区二区三区精品| 日本性xxx| 国产精一品亚洲二区在线播放| 亚洲区视频| 欧美fxxx| 2012中文字幕手机在线| 尿了么app| 国产精品久久久久a影院| 亚洲中文有码字幕日本| 浓毛BWBWBWBWBW日本| 国产九色在线| 97视频免费观看| 无码AV精品久久一区二区免费| 久久国产精品无码视欧美| thermo脱色摇床安卓下载| 亚洲福利精品电影在线观看| 蜜桃传媒在线播放| 99re久久这里只有精品| 婷婷五月久久精品国产亚洲| 久久中文字幕免费高清| 国产AV果冻传奇麻豆| 中文字幕亚洲无线码高清不卡| 深夜释放自己在线观看| 老师系列高H文| 国产精品无需播放器| 999久久久国产| 亚洲人成电影网站色2017| 日韩hd高清xxxⅹ| 恋夜直播午夜秀场最新| 国产一区二区三区国产精品| 99久久久精品| 一个人看的WWW高清电影| 收集最新中文国产中文字幕| 美女内射少妇一区二区四区| 好湿好滑好硬好爽好深视频| 东北足疗店妓女在线观看| 91麻豆久久| 在线不卡中文字幕| 亚洲精品视频区|