汽車行業“智能化”發展趨勢下,得益于硬件平臺和軟件算法逐步成熟,新車搭載各種L2級別的輔助駕駛功能成為吸引消費者的重要配置,另一方面,在“軟件定義汽車”的新時代,自動駕駛更是成為了影響車企未來發展的重要戰略。
自動駕駛領域市場參與者眾多,包括傳統車企、造車新勢力、互聯網/科技公司等。隨著入局者的增加,高階自動駕駛進入了競爭白熱化階段。智能汽車車載傳感器數量越來越多,自動駕駛神經網絡模型算法復雜度越來越高,相關功能也越來越豐富,自動駕駛的研發也面臨巨大的挑戰。
開發工具鏈的效率決定了整個智駕系統開發的效率,對于一家賦能全棧式自動駕駛能力的智能駕駛計算芯片公司而言,為客戶提供易操作、廣適配、高效率的工具鏈產品,幫助客戶建立從開發到量產的軟硬件全解耦軟件工具體系顯得尤為重要。黑芝麻智能深知軟硬協同的重要性,為幫助客戶更好地基于黑芝麻智能華山系列芯片進行產品開發,提升研發效率,降低開發門檻和綜合成本,加速產品量產,黑芝麻智能推出山海開發工具鏈平臺。
軟硬協同,深度優化,靈活部署
整體來看,黑芝麻智能山海開發工具鏈配合華山系列自動駕駛計算芯片,能提供全面的開發包及算法開發所需的軟件工具,滿足模型量化、優化、編譯、仿真、部署、調試等各個開發環節的需要,并納入深度學習參考模型庫轉換用例,大幅降低算法開發門檻,幫助客戶進行靈活的模型遷移、部署和整合。
黑芝麻智能山海開發工具鏈
黑芝麻智能山海開發工具鏈平臺支持Tensorflow,Pytorch等主流訓練框架和模型格式,支持動態異構多核任務分配,通過基于ONNX面向Caffe訓練的深度學習模型自動轉換方法來進行擴展,提供適配芯片架構的AI編譯器的自動優化,支持客戶自定義算子開發。能夠助力客戶快速移植模型和優化部署落地的一體化流程,提升自動駕駛開發者業務模型的開發及部署效率,黑芝麻智能山海開發工具鏈平臺目前擁有50+ AI參考模型庫及轉換用例,可大幅降低開發者算法開發門檻。例如車道線檢測、目標檢測等等一些模型結構,使用這些模型結構可以在華山系列芯片上更好地去發揮性能及快速部署落地。
量產級算法典型實踐
黑芝麻智能剪枝算法,提高模型效率
神經網絡在訓練完畢后,絕大多數權重是非零的。如果網絡中某些部分的權重為零,我們稱之為稀疏(sparsity)。剪枝(pruning)是指人為地將部分非零的權重歸零的過程。通過稀疏的網絡可以被壓縮,省去不必要的計算,讓網絡變得更小,運算更高效。更具體地說,在計算機視覺(CV)領域中,稀疏的網絡有如下優勢:更少的卷積(convolution)計算、更小的網絡權重、更低的數據讀入寫出(data I/O)成本。
針對華山系列芯片的硬件特性,黑芝麻智能開發了一套自研的剪枝工具BST-DAL,支持在任何預訓練模型上進行剪枝,可顯著提高模型在華山系列芯片上的運行速度。用戶只需修改幾行代碼,提供一些基本的剪枝超參數,就可實現在自己的原始訓練環境中剪枝。黑芝麻智能自研的剪枝工具相比于眾多開源項目,擁有更快的收斂速度、更高的精度、更適應芯片特性的剪枝算法、更簡便的API及更友好的用戶體驗。黑芝麻智能的剪枝算法能使模型在保證精度的前提下,將芯片上的運行幀率大幅提高。
黑芝麻智能量化算法,提升計算效率和性能
通過量化能將神經網絡模型的參數(權重和激活值)映射到較低的精度表示,從而降低計算和存儲成本,提高模型在硬件上的推理效率,在不顯著影響模型性能的前提下,減小計算和內存需求,這一技術可以通過后訓練量化或者量化感知訓練來實現。
現在市面上不同車型搭載不同硬件平臺,它們有不同的計算和存儲特性,部分硬件平臺可能還有特殊的定制要求或功能限制,很多通用的量化算法無法最大程度地利用硬件的優勢,滿足這些定制化需求。
黑芝麻智能針對特定硬件的約束和特性開發自研量化算法,以最大限度地提高計算效率和性能;同時根據硬件的位寬等特性,設計出更合適的量化策略,以平衡性能和資源消耗,靈活地控制量化的精度,使得在硬件資源受限的情況下,仍能保持模型的性能,滿足定制化的硬件需求,確保量化后的模型在特定硬件上能夠良好運行。
黑芝麻智能量化算法
華山二號A1000硬件特性
?權重按通道量化,部分激活可按通道量化;
?支持混合精度,利用多引擎的特性,提升算子位寬提升精度;
?硬件支持的是對稱量化和2的冪次方的量化;
?支持RGB/BGR/NV12/YUV444/GRAY等輸入的模型量化。
離線量化算法(Post-Training Quantization)
?可以進行逐層調優,包括最小-最大值、KL散度、百分位點等多種調優方式;
?支持權重均衡,提升量化效果;
?自研算法優化了int16 Conv的計算邏輯,保持精度的同時提高了效率;
?精細調優: 支持逐層的自動化精度調優來搜尋量化模型的最優解;
?支持通過導入帶有量化參數的JSON文件的形式進行自定義量化;
?提供量化后模型的評估階段,提供可視化工具,幫助分析和理解量化效果。
量化感知訓練(Quant-Aware Training)
?支持量化感知訓練,量化感知訓練與硬件對齊,進一步優化量化效果。
目前,黑芝麻智能山海開發工具鏈在60余家車廠及Tier 1生態用戶中得到廣泛應用,助力合作伙伴的研發團隊提升開發效率,為客戶提供輕松快速開發和部署算法的指導,全面的工具鏈SDK和應用程序,幫助客戶輕松部署優化模型。
賦能客戶 智駕未來
“目前國外芯片廠商,普遍存在底層開放度不足或迭代較慢的情況,例如面對新的算法需求,底層計算能力的拓展需要依賴國外技術團隊支持,響應速度較慢。此外,對底層bug的修復流程也比較冗長,面對客戶對時間和質量的高要求,軟硬一體迭代效率不盡如人意”。百度智能駕駛事業群組ASD硬件平臺部總經理趙姝巖在談到與國外芯片企業合作時說到,“而跟黑芝麻智能合作,在提供芯片的同時,為了更好的調用芯片能力,黑芝麻智能為我們還提供開放的山海開發工具鏈,極大的縮短了我們域控平臺開發時間,為客戶項目按時交付贏得寶貴時間,我們自主+自主開放的合作模式,一定會贏取更多客戶,"趙姝巖總經理無不對黑芝麻智能的合作充滿信心。
在黑芝麻智能主辦的“2023智能汽車芯片高峰論壇”上,億咖通科技高級副總裁張容波說到 “吉咖智能自主研發了行泊一體式智能駕駛平臺,集成兩塊黑芝麻智能華山二號A1000芯片,具備最高超100TOPS的算力。平臺最高可支持30個以上傳感器接入;通過不同數量的傳感器和算力單元的組合,可實現不同成本需求下的駕駛輔助能力組合;具備影子模式和OTA能力,配合自動駕駛云,實現用戶駕駛習慣學習、自動駕駛能力持續進化。” 正是黑芝麻智能華山系列芯片與山海工具鏈的軟硬協同,為吉咖智能提供了具備行業競爭力的智能駕駛方案,搭載該方案的吉利領克08車型已于8月8月開啟預售后,不到3天訂單就突破1萬臺。
基于黑芝麻智能華山系列芯片——億咖通智能駕駛解決方案
邊緣計算場景離不開算法的支持,華山SOM作為華山二號A1000芯片的衍生產品,天然支持黑芝麻智能山海開發工具鏈平臺。得益于不斷優化的AI工具鏈,華山SOM上已成功移植了目標檢測、點云、語義分割、雙目、人體姿態、人臉識別等多類算法模型,實現了包括ADAS、BSD、DMS、環視等在內的車載應用。對于新領域新算法需要的的新算子,黑芝麻智能可進行定制化開發,并提供第三方算法移植的技術支持。“基于華山系列芯片與山海工具鏈,圓周率科技能夠為客戶定制基于特殊應用場景的產品,快速覆蓋汽車、機器人及其他邊緣計算應用,為公司搶占新產品市場助力提效,我們基于華山SOM設計了商用車產品,45天左右就實現了樣件階段的全部功能,而且中間還包含了春節放假的時間。這當然離不開團隊和客戶的大力支持,但同時也證明產品本身的成熟度已經完全可以滿足市場的需求。”圓周率科技COO朱華偉對此表示。
黑芝麻智能智能致力于通過顛覆式的技術創新,為客戶提供最優的產品。隨著“芯片+開發工具鏈”產品矩陣逐步拓展和完善,黑芝麻智能將持續為行業帶來創新、高效、安全和可落地的方案。在汽車產業智能化的時代浪潮中,黑芝麻智能期待攜手更多產業鏈伙伴合作,共同用創新描繪汽車產業的新面貌。
審核編輯:彭菁
-
芯片
+關注
關注
455文章
50732瀏覽量
423249 -
軟硬件
+關注
關注
1文章
295瀏覽量
19198 -
智能汽車
+關注
關注
30文章
2844瀏覽量
107255 -
自動駕駛
+關注
關注
784文章
13787瀏覽量
166405 -
黑芝麻智能
+關注
關注
1文章
136瀏覽量
3327
原文標題:共赴山海 智駕未來 —— 黑芝麻智能山海?開發工具鏈高效賦能客戶智能駕駛量產落地
文章出處:【微信號:BlackSesameTech,微信公眾號:黑芝麻智能】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論