天垓100率先完成百億級參數(shù)大模型訓(xùn)練，天數(shù)智芯迎來新的里程碑

6月10日，在第五屆智源大會AI系統(tǒng)分論壇上，上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱“天數(shù)智芯”）對外宣布，在天垓100加速卡的算力集群，基于北京智源人工智能研究院（以下簡稱“智源研究院”）70億參數(shù)的Aquila語言基礎(chǔ)模型，使用代碼數(shù)據(jù)進(jìn)行繼續(xù)訓(xùn)練，穩(wěn)定運(yùn)行19天，模型收斂效果符合預(yù)期，證明天數(shù)智芯有支持百億級參數(shù)大模型訓(xùn)練的能力。

圖?天數(shù)智芯產(chǎn)品線總監(jiān)宋煜

在北京市海淀區(qū)的大力支持下，智源研究院、天數(shù)智芯與愛特云翔共同合作，聯(lián)手開展基于自主通用GPU的大模型CodeGen（高效編碼）項(xiàng)目，通過中文描述來生成可用的C、Java、Python代碼以實(shí)現(xiàn)高效編碼。智源研究院負(fù)責(zé)算法設(shè)計、訓(xùn)練框架開發(fā)、大模型的訓(xùn)練與調(diào)優(yōu)，天數(shù)智芯負(fù)責(zé)提供天垓100加速卡、構(gòu)建算力集群及全程技術(shù)支持，愛特云翔負(fù)責(zé)提供算存網(wǎng)基礎(chǔ)硬件及智能化運(yùn)維服務(wù)。

圖?天數(shù)智芯大模型訓(xùn)練全棧方案

在三方的共同努力下，在基于天垓100加速卡的算力集群上，100B Tokens編程語料、70億參數(shù)量的AquilaCode大模型參數(shù)優(yōu)化工作結(jié)果顯示，1個Epoch后loss下降到0.8，訓(xùn)練速度達(dá)到87K Tokens/s，線性加速比高達(dá)95%以上。與國際主流的A100加速卡集群相比，天垓100加速卡集群的收斂效果、訓(xùn)練速度、線性加速比相當(dāng)，穩(wěn)定性更優(yōu)。在HumanEval基準(zhǔn)數(shù)據(jù)集上，以Pass@1作為評估指標(biāo)，自主算力集群訓(xùn)練出來的模型測試結(jié)果達(dá)到相近參數(shù)級別大模型的SOAT水平，在AI編程能力與國際主流GPU產(chǎn)品訓(xùn)練結(jié)果相近。

圖?基于天垓100算力集群的AquilaCode大模型訓(xùn)練性能采樣

天垓100率先完成百億級參數(shù)大模型訓(xùn)練，邁出了自主通用GPU大模型應(yīng)用的重要的一步。這一成果充分證明了天垓產(chǎn)品可以支持大模型訓(xùn)練，打通了國內(nèi)大模型創(chuàng)新發(fā)展的關(guān)鍵“堵點(diǎn)”，對于我國大模型自主生態(tài)建設(shè)、產(chǎn)業(yè)鏈安全保障具有十分重大的意義。

接下來，天數(shù)智芯將與合作伙伴們繼續(xù)深入合作，建設(shè)更大規(guī)模的天垓100算力集群，完成更大參數(shù)規(guī)模的大模型訓(xùn)練，以自主通用GPU產(chǎn)品更好支持國內(nèi)大模型創(chuàng)新應(yīng)用，進(jìn)一步夯實(shí)我國算力基礎(chǔ)，助力人工智能產(chǎn)業(yè)自主生態(tài)建設(shè)。

關(guān)于智源研究院

北京智源人工智能研究院(簡稱“智源研究院”)是人工智能領(lǐng)域的新型研發(fā)機(jī)構(gòu)。2018年11月14日，聯(lián)合北京多家人工智能領(lǐng)域優(yōu)勢單位共建。智源研究院的愿景和目標(biāo)是聚焦原始創(chuàng)新和核心技術(shù)，建立目標(biāo)導(dǎo)向與自由探索相結(jié)合的科研體制，營造全球最佳的學(xué)術(shù)和技術(shù)創(chuàng)新生態(tài)，推動北京成為全球人工智能學(xué)術(shù)思想、基礎(chǔ)理論、頂尖人才、企業(yè)創(chuàng)新和發(fā)展政策的源頭，率先成為國際領(lǐng)先的人工智能創(chuàng)新中心，推動人工智能產(chǎn)業(yè)發(fā)展和深度應(yīng)用，改變?nèi)祟惿鐣睿龠M(jìn)人類、環(huán)境和智能的可持續(xù)發(fā)展。

關(guān)于天數(shù)智芯

上海天數(shù)智芯半導(dǎo)體有限公司（簡稱“天數(shù)智芯”）是中國領(lǐng)先的通用GPU 高端芯片及超級算力系統(tǒng)提供商。天數(shù)智芯以“服務(wù)國家戰(zhàn)略”為己任，堅持“四個面向”，致力于開發(fā)自主可控、國際領(lǐng)先的高性能通用GPU產(chǎn)品，探索通用GPU趕超發(fā)展道路，加快建設(shè)自主產(chǎn)業(yè)生態(tài)，為全產(chǎn)業(yè)提供高端算力解決方案。未來，天數(shù)智芯將堅持中國特色的自主自強(qiáng)創(chuàng)新發(fā)展道路，打造更可信、更高效、更綠色的世界一流算力引擎，賦能千行百業(yè)數(shù)字化轉(zhuǎn)型，促進(jìn)我國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展，開啟中國引領(lǐng)世界走向元宇宙、數(shù)字孿生的嶄新一頁。

關(guān)于愛特云翔

愛特云翔專注為政企客戶提供大數(shù)據(jù)中心、云計算、人工智能服務(wù)，是以“cloud + AI”為技術(shù)基座的科技創(chuàng)新型企業(yè)。愛特云翔目前擁有淄博臨淄、寧夏中衛(wèi)、青島即墨等三個大數(shù)據(jù)產(chǎn)業(yè)園和IDC，總機(jī)柜數(shù)為2.2萬個，已具備覆蓋華北、華中、華東、華南的光纖網(wǎng)絡(luò)，建立有北京、上海、淄博軟件與算法研發(fā)中心、濟(jì)南技術(shù)支持中心、深圳硬件設(shè)計中心、聊城智能物聯(lián)生產(chǎn)線，及全國各地子公司等分支機(jī)構(gòu)。

閱讀全文

解決AIGC大模型對網(wǎng)絡(luò)的5大需求

從Transformer問世至2023年ChatGPT爆火到2024年Sora吸睛，人們逐漸意識到隨著模型參數(shù)規(guī)模增加，模型的效果越來越好，且兩者之間符合Scalinglaw規(guī)律，且當(dāng)模型的參數(shù)規(guī)模超過數(shù)百億后

2024-03-22 16:40:28

135

【書籍評測活動NO.31】大語言模型：原理與工程實(shí)踐

章節(jié)，提供大語言模型微調(diào)的詳細(xì)指導(dǎo)，逐步引領(lǐng)讀者掌握關(guān)鍵技能。這不僅有助于初學(xué)者迅速上手，也為有經(jīng)驗(yàn)的開發(fā)者提供了深入學(xué)習(xí)的機(jī)會。作為真正的大語言模型實(shí)踐者，我們擁有十億、百億、千億等不同參數(shù)規(guī)模大語言

2024-03-18 15:49:46

大模型訓(xùn)練：為何A100更勝4090一籌？

首先看吞吐量，看起來沒有什么違和的，在單卡能放下模型的情況下，確實(shí)是 H100 的吞吐量最高，達(dá)到 4090 的兩倍。

2024-03-13 12:27:28

353

【書籍評測活動NO.30】大規(guī)模語言模型：從理論到實(shí)踐

學(xué)習(xí)展開，詳細(xì)介紹各階段使用的算法、數(shù)據(jù)、難點(diǎn)及實(shí)踐經(jīng)驗(yàn)。預(yù)訓(xùn)練階段需要利用包含數(shù)千億甚至數(shù)萬億單詞的訓(xùn)練數(shù)據(jù)，并借助由數(shù)千塊高性能GPU 和高速網(wǎng)絡(luò)組成的超級計算機(jī)，花費(fèi)數(shù)十天完成深度神經(jīng)網(wǎng)絡(luò)參數(shù)

2024-03-11 15:16:39

谷歌模型訓(xùn)練軟件有哪些？谷歌模型訓(xùn)練軟件哪個好？

谷歌在模型訓(xùn)練方面提供了一些強(qiáng)大的軟件工具和平臺。以下是幾個常用的谷歌模型訓(xùn)練軟件及其特點(diǎn)。

2024-03-01 16:24:01

183

谷歌模型訓(xùn)練軟件有哪些功能和作用

谷歌模型訓(xùn)練軟件主要是指ELECTRA，這是一種新的預(yù)訓(xùn)練方法，源自谷歌AI。ELECTRA不僅擁有BERT的優(yōu)勢，而且在效率上更勝一籌。

2024-02-29 17:37:39

336

只修改一個關(guān)鍵參數(shù)，就會毀了整個百億參數(shù)大模型？

2022 年開始，我們發(fā)現(xiàn) Multilingual BERT 是一個經(jīng)過大規(guī)模跨語言訓(xùn)練驗(yàn)證的模型實(shí)例，其展示出了優(yōu)異的跨語言遷移能力。具

2024-02-20 14:51:35

221

混合專家模型 (MoE)核心組件和訓(xùn)練方法介紹

): 與稠密模型相比，預(yù)訓(xùn)練速度更快與具有相同參數(shù)數(shù)量的模型相比，具有更快的推理速度需要大量顯存，因?yàn)樗袑＜蚁到y(tǒng)都需要加載到內(nèi)存中在微調(diào)方面

2024-01-13 09:37:33

315

百度地圖宣布城市車道級導(dǎo)航取得里程碑突破

近日，百度地圖宣布其城市車道級導(dǎo)航取得里程碑突破，已率先覆蓋全國超100城普通道路。

2024-01-09 17:28:51

627

辰顯光電完成數(shù)億元A輪融資

成都辰顯光電有限公司（以下簡稱“辰顯光電”）近日完成了數(shù)億元A輪融資，這是其發(fā)展歷程中的又一重要里程碑。

2024-01-03 14:44:02

462

四種微調(diào)大模型的方法介紹

全微調(diào)（Full Fine-tuning）：全微調(diào)是指對整個預(yù)訓(xùn)練模型進(jìn)行微調(diào)，包括所有的模型參數(shù)。在這種方法中，預(yù)訓(xùn)練模型的所有層和參數(shù)都會被更新和優(yōu)化，以適應(yīng)目標(biāo)任務(wù)的需求。

2024-01-03 10:57:21

2273

國產(chǎn)順磁共振譜儀發(fā)展里程碑！國儀量子EPR實(shí)現(xiàn)全球交付100臺

12月28日，國儀量子向上海大學(xué)理學(xué)院正式交付X波段連續(xù)波電子順磁共振波譜儀EPR200-Plus，標(biāo)志著國儀量子自主研制的電子順磁共振波譜儀實(shí)現(xiàn)了全球交付100臺的重要里程碑。上海大學(xué)理學(xué)院常務(wù)副

2023-12-30 08:25:02

172

1-2B參數(shù)規(guī)模大模型的使用心得

大模型時代，根據(jù)大模型縮放定律，大家通常都在追求模型的參數(shù)規(guī)模更大、訓(xùn)練的數(shù)據(jù)更多，從而使得大模型涌現(xiàn)出更多的智能。但是，模型參數(shù)越大部署壓力就越大。即使有g(shù)ptq、fastllm、vllm等推理加速方法，但如果GPU資源不夠也很難保證高并發(fā)。

2023-12-28 11:47:14

432

“龍鷹一號”迎來出貨量20萬片里程碑，助力首搭車型成為爆款，眾多搭載車型陸續(xù)上市

2023年12月25日，領(lǐng)先的汽車電子芯片整體解決方案提供商湖北芯擎科技有限公司（以下簡稱：芯擎科技）正式公布其商業(yè)業(yè)績的重要里程碑 –?首款國產(chǎn)7納米高算力車規(guī)級芯片“龍鷹一號”自年內(nèi)開始量產(chǎn)交付

2023-12-26 10:37:10

313

基于YOLOv8實(shí)現(xiàn)自定義姿態(tài)評估模型訓(xùn)練

Hello大家好，今天給大家分享一下如何基于YOLOv8姿態(tài)評估模型，實(shí)現(xiàn)在自定義數(shù)據(jù)集上，完成自定義姿態(tài)評估模型的訓(xùn)練與推理。

2023-12-25 11:29:01

968

如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)工件切割點(diǎn)位置預(yù)測

Hello大家好，今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)工件切割點(diǎn)位置預(yù)測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓(xùn)練，生成一個工件切割分離點(diǎn)預(yù)測模型

2023-12-22 11:07:46

258

如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)圓檢測與圓心位置預(yù)測

Hello大家好，今天給大家分享一下如何基于深度學(xué)習(xí)模型訓(xùn)練實(shí)現(xiàn)圓檢測與圓心位置預(yù)測，主要是通過對YOLOv8姿態(tài)評估模型在自定義的數(shù)據(jù)集上訓(xùn)練，生成一個自定義的圓檢測與圓心定位預(yù)測模型

2023-12-21 10:50:05

513

【飛騰派4G版免費(fèi)試用】第三章：抓取圖像，手動標(biāo)注并完成自定義目標(biāo)檢測模型訓(xùn)練和測試

抓取圖像，手動標(biāo)注并完成自定義目標(biāo)檢測模型訓(xùn)練和測試在第二章中，我介紹了模型訓(xùn)練的一般過程，其中關(guān)鍵的過程是帶有標(biāo)注信息的數(shù)據(jù)集獲取。訓(xùn)練過程中可以已有的數(shù)據(jù)集合不能滿足自己的要求，這時候就需要

2023-12-16 10:05:19

【飛騰派4G版免費(fèi)試用】第三章：抓取圖像，手動標(biāo)注并完成自定義目標(biāo)檢測模型訓(xùn)練和測試

本章記錄了如何從網(wǎng)上抓取素材并進(jìn)行標(biāo)注，然后訓(xùn)練，導(dǎo)出測試自己的模型。

2023-12-16 09:55:18

266

【愛芯派 Pro 開發(fā)板試用體驗(yàn)】模型部署（以mobilenetV2為例）

的，只不過主角這次換成了pulsar2: 1、先在服務(wù)器上訓(xùn)練好網(wǎng)絡(luò)模型，并以一個通用的中間形式導(dǎo)出（通常是onnx） 2、根據(jù)你要使用的推理引擎進(jìn)行離線轉(zhuǎn)換，把onnx轉(zhuǎn)換成你的推理引擎能部署的模型

2023-12-10 16:34:43

深度學(xué)習(xí)如何訓(xùn)練出好的模型

和足夠的計算資源，還需要根據(jù)任務(wù)和數(shù)據(jù)的特點(diǎn)進(jìn)行合理的超參數(shù)調(diào)整、數(shù)據(jù)增強(qiáng)和模型微調(diào)。在本文中，我們將會詳細(xì)介紹深度學(xué)習(xí)模型的訓(xùn)練流程，探討超參數(shù)設(shè)置、數(shù)據(jù)增強(qiáng)技

2023-12-07 12:38:24

543

武漢芯源半導(dǎo)體首款車規(guī)級MCU，CW32A030C8T7通過AEC-Q100測試考核

近日，武漢芯源半導(dǎo)體正式發(fā)布首款基于Cortex?-M0+內(nèi)核的CW32A030C8T7車規(guī)級MCU，這是武漢芯源半導(dǎo)體首款通過AEC-Q100 (Grade 2)車規(guī)標(biāo)準(zhǔn)的主流通用型車規(guī)MCU產(chǎn)品

2023-11-30 15:47:01

天數(shù)智芯支持智源研究院首次完成大模型異構(gòu)算力混合訓(xùn)練，突破異構(gòu)算力束縛

基于英偉達(dá)混合資源及天數(shù)智芯混合資源完成訓(xùn)練的大模型，也是智源研究院與天數(shù)智芯合作取得的最新成果，再次證明了天數(shù)智芯通用 GPU 產(chǎn)品支持大模型訓(xùn)練的能力，以及與主流產(chǎn)品的兼容能力。據(jù)林詠華副院長介紹，為了解決異構(gòu)算力混合訓(xùn)練難題，智源研究院開發(fā)了高效并行訓(xùn)練框

2023-11-30 13:10:02

727

【AI簡報20231103期】ChatGPT參數(shù)揭秘，中文最強(qiáng)開源大模型來了！

和 50% - 75% 的通信成本，而且英偉達(dá)最新一代卡皇 H100 自帶良好的 FP8 硬件支持。但目前業(yè)界大模型訓(xùn)練框架對 FP8 訓(xùn)練的支持還非常有限。最近，微軟提出了

2023-11-03 19:15:01

848

如何讓網(wǎng)絡(luò)模型加速訓(xùn)練

的博文，對 Pytorch的AMP ( autocast與Gradscaler 進(jìn)行對比) 自動混合精度對模型訓(xùn)練加速。注意Pytorch1.6+，已經(jīng)內(nèi)置torch.cuda.amp，因此便不需要加載

2023-11-03 10:00:19

1054

瘋狂的H100：現(xiàn)代GPU體系結(jié)構(gòu)淺析，從算力焦慮開始聊起

昂貴 H100 的一時洛陽紙貴，供不應(yīng)求，大模型訓(xùn)練究竟需要多少張卡呢？GPT-4 很有可能是在 10000 到 20000 張 A100 的基礎(chǔ)上訓(xùn)練完成的[8]。按照 Elon Musk 的說法

2023-10-29 09:48:13

4184

【KV260視覺入門套件試用體驗(yàn)】Vitis AI 通過遷移學(xué)習(xí)訓(xùn)練自定義模型

【Vitis AI】 Vitis AI 通過遷移學(xué)習(xí)訓(xùn)練自定義模型測評計劃：一、開箱報告，KV260通過網(wǎng)線共享PC網(wǎng)絡(luò) 二、Zynq超強(qiáng)輔助-PYNQ配置，并使用XVC(Xilinx

2023-10-16 15:03:16

VisionFive 2成功集成Android開源項(xiàng)目（AOSP）!

非常高興地向各位宣布，賽昉VisionFive 2上已成功集成了Android開源項(xiàng)目（AOSP），為用戶帶來了更多的軟件解決方案以及與Android軟件生態(tài)系統(tǒng)的無縫集成。這一里程碑源于與開源社區(qū)

2023-10-16 13:11:45

深度學(xué)習(xí)模型部署與優(yōu)化：策略與實(shí)踐；L40S與A100、H100的對比分析

深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、生成式AI、深度神經(jīng)網(wǎng)絡(luò)、抽象學(xué)習(xí)、Seq2Seq、VAE、GAN、GPT、BERT、預(yù)訓(xùn)練語言模型、Transformer、ChatGPT、GenAI、多模態(tài)大模型、視覺大模型

2023-09-22 14:13:09

605

下肢外骨骼康復(fù)訓(xùn)練機(jī)器人

邁步機(jī)器人BEAR-H系列是用于輔助腦卒中患者步態(tài)康復(fù)訓(xùn)練的新型可穿戴式下肢外骨骼機(jī)器人。機(jī)器人擁有主動被動訓(xùn)練模式，通過對患者髖、膝、踝關(guān)節(jié)提供助力完成行走訓(xùn)練，可以節(jié)省人力，并提高康復(fù)效果

2023-09-20 17:25:48

大語言模型（LLM）預(yù)訓(xùn)練數(shù)據(jù)集調(diào)研分析

model 訓(xùn)練完成后，使用 instruction 以及其他高質(zhì)量的私域數(shù)據(jù)集來提升 LLM 在特定領(lǐng)域的性能；而 rlhf 是 openAI 用來讓model 對齊人類價值觀的一種強(qiáng)大技術(shù)；pre-training dataset 是大模型在訓(xùn)練時真正喂給 model 的數(shù)據(jù)，從很多 paper 能看到一些觀

2023-09-19 10:00:06

505

使用bmpaddle轉(zhuǎn)換模型時應(yīng)該如何參數(shù)填寫方式

,608,609]\" –model參數(shù)到模型所在文件夾那一級；paddle模型有2種：組合式(combined model)和非復(fù)合式(uncombined model)；組合式就是__model__

2023-09-19 07:05:28

里程碑!全球第500萬輛特斯拉在上海超級工廠正式下線

洞見分析

電子發(fā)燒友網(wǎng)官方發(fā)布于 2023-09-18 10:37:13

大模型訓(xùn)練為什么不能用4090顯卡，GPU訓(xùn)練性能和成本對比

為什么？一般有 tensor parallelism、pipeline parallelism、data parallelism 幾種并行方式，分別在模型的層內(nèi)、模型的層間、訓(xùn)練數(shù)據(jù)三個維度上對 GPU 進(jìn)行劃分。三個并行度乘起來，就是這個訓(xùn)練任務(wù)總的 GPU 數(shù)量。

2023-09-15 11:16:21

12059

請問K510設(shè)備什么時候可以支持線上模型訓(xùn)練？

目前官方的線上模型訓(xùn)練只支持K210，請問K510什么時候可以支持

2023-09-13 06:12:13

開源大模型FLM-101B：訓(xùn)練成本最低的超100B參數(shù)大模型

近期，一支來自中國的研究團(tuán)隊(duì)正是針對這些問題提出了解決方案，他們推出了FLM-101B模型及其配套的訓(xùn)練策略。FLM-101B不僅大幅降低了訓(xùn)練成本，而且其性能表現(xiàn)仍然非常出色，它是目前訓(xùn)練成本最低的100B+ LLM。

2023-09-12 16:30:30

921

揭秘英偉達(dá)A100、A800、H100、H800 GPU如何實(shí)現(xiàn)高性能大模型的百倍訓(xùn)練加速

摘要：本文主要介紹大模型的內(nèi)部運(yùn)行原理、我國算力發(fā)展現(xiàn)狀。大模型指具有巨大參數(shù)量的深度學(xué)習(xí)模型，如GPT-4。其通過在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練，能夠產(chǎn)生更加準(zhǔn)確和有創(chuàng)造性的結(jié)果。大模型的內(nèi)部運(yùn)行

2023-09-09 11:15:56

1261

國產(chǎn)GPU打造強(qiáng)大算力底座，天數(shù)智芯助力大模型創(chuàng)新發(fā)展

大模型落地實(shí)踐》的主題演講，深入介紹了天數(shù)智芯通用GPU產(chǎn)品以及自主算力解決方案，為大模型創(chuàng)新發(fā)展打造堅實(shí)算力底座。 天數(shù)智芯副總裁郭為郭為指出，大模型的飛速發(fā)展產(chǎn)生超預(yù)期效果，為人工智能發(fā)展帶來了新的機(jī)遇。順應(yīng)發(fā)展需求

2023-09-07 17:15:05

574

盤古大模型與ChatGPT的模型基礎(chǔ)架構(gòu)

華為盤古大模型以Transformer模型架構(gòu)為基礎(chǔ)，利用深層學(xué)習(xí)技術(shù)進(jìn)行訓(xùn)練。模型的每個數(shù)量達(dá)到2.6億個，是目前世界上最大的漢語預(yù)備訓(xùn)練模型之一。這些模型包含許多小模型，其中最大的模型包含1億4千萬個參數(shù)。

2023-09-05 09:55:56

1228

訓(xùn)練大語言模型帶來的硬件挑戰(zhàn)

生成式AI和大語言模型（LLM）正在以難以置信的方式吸引全世界的目光，本文簡要介紹了大語言模型，訓(xùn)練這些模型帶來的硬件挑戰(zhàn)，以及GPU和網(wǎng)絡(luò)行業(yè)如何針對訓(xùn)練的工作負(fù)載不斷優(yōu)化硬件。

2023-09-01 17:14:56

1046

天數(shù)智芯與算力互聯(lián)公司簽署算力互聯(lián)網(wǎng)合作框架協(xié)議

基礎(chǔ)設(shè)施和通信基礎(chǔ)設(shè)施等領(lǐng)域開展緊密合作，全面提升自主算力供給能力和服務(wù)水平，助力我國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。 天數(shù)算力是上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱“天數(shù)智芯”）的全資子公司。作為國內(nèi)率先開展通用GPU設(shè)計的初創(chuàng)

2023-08-30 11:47:18

848

Transphorm氮化鎵器件率先達(dá)到對電機(jī)驅(qū)動應(yīng)用至關(guān)重要的抗短路穩(wěn)健性里程碑

同類產(chǎn)品有記錄以來首次達(dá)到的成就，也是整個行業(yè)的一個重要里程碑，證明 Transphorm 的氮化鎵器件能夠滿足伺服

2023-08-28 13:44:35

154

使用OpenVINO優(yōu)化并部署訓(xùn)練好的YOLOv7模型

在《英特爾銳炫顯卡+ oneAPI 和 OpenVINO 實(shí)現(xiàn)英特爾視頻 AI 計算盒訓(xùn)推一體-上篇》一文中，我們詳細(xì)介紹基于英特爾獨(dú)立顯卡搭建 YOLOv7 模型的訓(xùn)練環(huán)境，并完成了 YOLOv7 模型訓(xùn)練，獲得了最佳精度的模型權(quán)重。

2023-08-25 11:08:58

817

大模型分布式訓(xùn)練并行技術(shù)（一）-概述

數(shù)據(jù)并行是最常見的并行形式，因?yàn)樗芎唵巍Ｔ跀?shù)據(jù)并行訓(xùn)練中，數(shù)據(jù)集被分割成幾個碎片，每個碎片被分配到一個設(shè)備上。這相當(dāng)于沿批次（Batch）維度對訓(xùn)練過程進(jìn)行并行化。每個設(shè)備將持有一個完整的模型副本，并在分配的數(shù)據(jù)集碎片上進(jìn)行訓(xùn)練。

2023-08-24 15:17:28

537

完成適配！曦云C500在智譜AI升級版大模型上充分兼容、高效穩(wěn)定運(yùn)行

近日，沐曦集成電路（上海）有限公司（下稱“沐曦”）曦云C500千億參數(shù)AI大模型訓(xùn)練及通用計算GPU與北京智譜華章科技有限公司（下稱“智譜AI”）開源的中英雙語對話語言模型ChatGLM2-6B完成

2023-08-23 10:38:47

3028

卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練步驟

模型訓(xùn)練是將模型結(jié)構(gòu)和模型參數(shù)相結(jié)合，通過樣本數(shù)據(jù)的學(xué)習(xí)訓(xùn)練模型，使得模型可以對新的樣本數(shù)據(jù)進(jìn)行準(zhǔn)確的預(yù)測和分類。本文將詳細(xì)介紹 CNN 模型訓(xùn)練的步驟。 CNN 模型結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)的輸入

2023-08-21 16:42:00

884

天數(shù)智芯與百度聯(lián)合發(fā)起飛槳+文心大模型硬件生態(tài)共創(chuàng)計劃

生態(tài)共創(chuàng)計劃，天數(shù)智芯作為重要合作伙伴參與此次發(fā)布儀式。飛槳+ 文心大模型硬件生態(tài)共創(chuàng)計劃發(fā)布儀式 天數(shù)智芯是國內(nèi)首家實(shí)現(xiàn)通用GPU量產(chǎn)的硬科技企業(yè)，公司天垓、智鎧兩大系列通用GPU產(chǎn)品具有全自主、高性能、廣通用等特點(diǎn)，廣泛適用互聯(lián)網(wǎng)、智能安防、生物

2023-08-17 22:15:01

836

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎

模型，以便將來能夠進(jìn)行準(zhǔn)確的預(yù)測。推理是指在訓(xùn)練完成后，使用已經(jīng)訓(xùn)練好的模型進(jìn)行新的預(yù)測。然而，深度學(xué)習(xí)框架是否區(qū)分訓(xùn)練和推理呢？大多數(shù)深度學(xué)習(xí)框架是區(qū)分訓(xùn)練和推理的。這是因?yàn)椋?b class="flag-6" style="color: red">訓(xùn)練和推理過程中，使用的是

2023-08-17 16:03:11

905

盤古大模型參數(shù)量有多少

盤古大模型參數(shù)量有多少盤古大模型（PanGu-α）是由中國科學(xué)院計算技術(shù)研究所提供的一種語言生成預(yù)訓(xùn)練模型。該模型基于Transformer網(wǎng)絡(luò)架構(gòu)，并通過在超過1.1TB的文本數(shù)據(jù)上進(jìn)行訓(xùn)練

2023-08-17 11:28:18

1769

天數(shù)智芯與愛可生完成產(chǎn)品兼容性互認(rèn)證，攜手推動自主生態(tài)體系建設(shè)

近日，上海天數(shù)智芯半導(dǎo)體有限公司（簡稱 “天數(shù)智芯”）與上海愛可生信息技術(shù)股份有限公司（以下簡稱 “愛可生”）完成產(chǎn)品兼容性互認(rèn)證。結(jié)論顯示： 天數(shù)智芯通用 GPU產(chǎn)品智鎧MR-V50

2023-08-12 14:30:03

1109

突破200萬 | 聯(lián)合電子電機(jī)銷售量新里程碑

新佳績繼聯(lián)合電子新一代X-Pin電機(jī)正式批產(chǎn)后，公司又迎來了一個重要里程碑。截至2023年6月底，聯(lián)合電子電機(jī)產(chǎn)品累計銷售量突破200萬！從2013年首個電機(jī)項(xiàng)目IMG290批產(chǎn)，到2022年年

2023-08-06 08:35:01

880

訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么解決？

訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦，試了好幾個模型壓縮了也不行，ram占用過大，有無解決方案？

2023-08-04 09:16:28

如何使用TensorFlow將神經(jīng)網(wǎng)絡(luò)模型部署到移動或嵌入式設(shè)備上

有很多方法可以將經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型部署到移動或嵌入式設(shè)備上。不同的框架在各種平臺上支持Arm，包括TensorFlow、PyTorch、Caffe2、MxNet和CNTK，如Android

2023-08-02 06:43:57

英偉達(dá) H100 vs 蘋果M2 大模型訓(xùn)練，哪款性價比更高？

訓(xùn)練和微調(diào)大型語言模型對于硬件資源的要求非常高。目前，主流的大模型訓(xùn)練硬件通常采用英特爾的CPU和英偉達(dá)的GPU。然而，最近蘋果的M2 Ultra芯片和AMD的顯卡進(jìn)展給我們帶來了一些新的希望。

2023-07-28 16:11:01

2123

高通：未來幾個月有望在終端側(cè)運(yùn)行超100億參數(shù)的模型

電子發(fā)燒友網(wǎng)報道（文/李彎彎）日前，在2023世界半導(dǎo)體大會暨南京國際半導(dǎo)體博覽會上，高通全球副總裁孫剛發(fā)表演講時談到，目前高通能夠支持參數(shù)超過10億的模型在終端上運(yùn)行，未來幾個月內(nèi)超過100億參數(shù)

2023-07-26 00:15:00

1058

夯實(shí)算力基礎(chǔ) 賦能大模型創(chuàng)新發(fā)展

《國產(chǎn) GPU的大模型實(shí)踐》的主題演講，全面介紹了天數(shù)智芯通用 GPU產(chǎn)品特色以及在大模型上的應(yīng)用情況。 天數(shù)智芯副總裁郭為郭為指出，算力關(guān)乎大模型產(chǎn)品的成敗。作為中國領(lǐng)先的通用GPU 高端芯片及超級算力系統(tǒng)提供商，天數(shù)智芯先后發(fā)布了訓(xùn)練產(chǎn)品天垓100、推理產(chǎn)品智鎧100，

2023-07-17 22:25:02

397

華為發(fā)布大模型時代AI存儲新品

準(zhǔn)備時間長，數(shù)據(jù)來源分散，歸集慢，預(yù)處理百TB數(shù)據(jù)需10天左右； ● 其次，多模態(tài)大模型以海量文本、圖片為訓(xùn)練集，當(dāng)前海量小文件的加載速度不足100MB/s，訓(xùn)練集加載效率低； ● 第三，大模型參數(shù)頻繁調(diào)優(yōu)，訓(xùn)練平臺不穩(wěn)定，平均約2天出現(xiàn)一次訓(xùn)

2023-07-14 15:20:02

475

2023WAIC完美收官，天數(shù)智芯閃耀自主通用GPU光芒

7月6日-8日，為期三天的2023世界人工智能大會（WAIC）圓滿落幕！作為國內(nèi)率先實(shí)現(xiàn)通用GPU量產(chǎn)應(yīng)用的硬科技企業(yè)，天數(shù)智芯重磅展示了天垓、智鎧系列通用GPU產(chǎn)品在大模型方面的最新應(yīng)用成果以及

2023-07-11 23:05:01

835

對話天數(shù)智芯董事長兼CEO蓋魯江：國產(chǎn)通用GPU性能提升的四大抓手

而言，核心三要素是算法、數(shù)據(jù)和算力，其中算力是底座。 ?對于算力而言，目前行業(yè)基本的共識是基于通用GPU來構(gòu)建AI大模型的算力集群，上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱：天數(shù)智芯）是目前國內(nèi)第一家實(shí)現(xiàn)通用GPU量產(chǎn)并落地的公司。在WAIC上，天數(shù)

2023-07-11 01:07:00

2454

如何計算transformer模型的參數(shù)量

參數(shù)規(guī)模大，訓(xùn)練數(shù)據(jù)規(guī)模大。以GPT3為例，GPT3的參數(shù)量為1750億，訓(xùn)練數(shù)據(jù)量達(dá)到了570GB。進(jìn)而，訓(xùn)練大規(guī)模語言模型面臨兩個主要挑戰(zhàn)：顯存效率和計算效率。現(xiàn)在業(yè)界的大語言模型都是

2023-07-10 09:13:57

5726

貿(mào)澤電子榮獲Amphenol 2022年度里程碑獎

Corporation頒發(fā)的2022年度里程碑獎。貿(mào)澤長期備貨Amphenol旗下40多個產(chǎn)品部門的全線產(chǎn)品，客戶可前往貿(mào)澤官網(wǎng)mouser.cn進(jìn)行購買。 ? 該獎項(xiàng)頒發(fā)給貿(mào)澤團(tuán)隊(duì)，包括供應(yīng)商經(jīng)理

2023-07-07 16:58:28

293

墨芯人工智能發(fā)布大模型算力方案的最新成果

又一里程碑。在活動現(xiàn)場，墨芯展臺成為全場熱點(diǎn)：1760億參數(shù)的大語言模型Bloom在墨芯AI計算平臺的推理引擎支持下，能夠快速、流暢地回答各類問題，并完成詩歌創(chuàng)作、文案撰寫等多項(xiàng)語言生成任務(wù)，贏得現(xiàn)場觀眾的關(guān)注與贊嘆。墨芯在千億參

2023-07-07 14:41:17

531

人氣爆表！天數(shù)智芯攜最新大模型落地成果亮相2023世界人工智能大會

7月6日，2023世界人工智能大會在上海世博中心正式開幕。上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱“天數(shù)智芯”）攜大模型訓(xùn)練、推理以及20+行業(yè)應(yīng)用案例亮相WAIC，以視頻、互動等多方式呈現(xiàn)，吸引眾多

2023-07-07 08:20:02

424

天數(shù)智芯與云脈芯聯(lián)完成產(chǎn)品兼容性認(rèn)證，共同推進(jìn)自主AI算力解決方案落地

近日，上海天數(shù)智芯半導(dǎo)體有限公司（簡稱“天數(shù)智芯”）與上海云脈芯聯(lián)科技有限公司（簡稱“云脈芯聯(lián)”）完成產(chǎn)品兼容性認(rèn)證。在AI大模型智算中心場景下，雙方共同對天數(shù)智芯通用GPU產(chǎn)品天垓100系列產(chǎn)品

2023-06-30 17:50:03

865

天數(shù)智芯副董事長蔡全根一行赴湖南湘江新區(qū)拜訪交流

天數(shù)智芯在湘江新區(qū)的布局合作事宜。 天數(shù)智芯首席運(yùn)營官劉崢等人陪同參加。蔡全根副董事長首先對譚勇書記的熱情接待表示衷心的感謝。蔡全根表示，天數(shù)智芯率先實(shí)現(xiàn)國內(nèi)通用GPU從0到1的重點(diǎn)突破，發(fā)布的兩款通用GPU產(chǎn)品天垓100、智鎧

2023-06-29 22:30:01

776

通往AGI之路：揭秘英偉達(dá)A100、A800、H800、V100在高性能計算與大模型訓(xùn)練中的霸主地位

英偉達(dá)前段時間發(fā)布GH 200包含 36 個 NVLink 開關(guān)，將 256 個 GH200 Grace Hopper 芯片和 144TB 的共享內(nèi)存連接成一個單元。除此之外，英偉達(dá)A100、A800、H100、V100也在大模型訓(xùn)練中廣受歡迎。

2023-06-29 11:23:58

25390

基于一個完整的 LLM 訓(xùn)練流程

? ? 在這篇文章中，我們將盡可能詳細(xì)地梳理一個完整的 LLM 訓(xùn)練流程。包括模型預(yù)訓(xùn)練（Pretrain）、Tokenizer 訓(xùn)練、指令微調(diào)（Instruction Tuning）等環(huán)節(jié)。文末

2023-06-29 10:08:59

1200

SA-1B數(shù)據(jù)集的1/50進(jìn)行訓(xùn)練現(xiàn)有的實(shí)例分割方法

SAM被認(rèn)為是里程碑式的視覺基礎(chǔ)模型，它可以通過各種用戶交互提示來引導(dǎo)圖像中的任何對象的分割。SAM利用在廣泛的SA-1B數(shù)據(jù)集上訓(xùn)練的Transformer模型，使其能夠熟練處理各種場景和對象。

2023-06-28 15:08:33

2574

河套IT TALK95：（原創(chuàng)）GPT技術(shù)揭秘：大模型訓(xùn)練會導(dǎo)向滅霸的響指嗎？

1. 大模型訓(xùn)練的套路昨天寫了一篇關(guān)于生成式模型的訓(xùn)練之道，覺得很多話還沒有說完，一些關(guān)鍵點(diǎn)還沒有點(diǎn)透，決定在上文的基礎(chǔ)上，再深入探討一下大模型訓(xùn)練這個話題。任何一個大模型的訓(xùn)練，萬變不離其宗

2023-06-21 19:55:02

312

DeepSpeed結(jié)合Megatron-LM訓(xùn)練GPT2模型筆記

本文基于DeepSpeedExamples倉庫中給出的Megatron相關(guān)例子探索一下訓(xùn)練GPT2模型的流程。主要包含3個部分，第一個部分是基于原始的Megatron如何訓(xùn)練GPT2模型，第二個部分

2023-06-19 14:45:13

1717

基于預(yù)訓(xùn)練模型和語言增強(qiáng)的零樣本視覺學(xué)習(xí)

在一些非自然圖像中要比傳統(tǒng)模型表現(xiàn)更好 CoOp 增加一些 prompt 會讓模型能力進(jìn)一步提升怎么讓能力更好？可以引入其他知識，即其他的預(yù)訓(xùn)練模型，包括大語言模型、多模態(tài)模型也包括

2023-06-15 16:36:11

276

NLP中的遷移學(xué)習(xí)：利用預(yù)訓(xùn)練模型進(jìn)行文本分類

遷移學(xué)習(xí)徹底改變了自然語言處理（NLP）領(lǐng)域，允許從業(yè)者利用預(yù)先訓(xùn)練的模型來完成自己的任務(wù)，從而大大減少了訓(xùn)練時間和計算資源。在本文中，我們將討論遷移學(xué)習(xí)的概念，探索一些流行的預(yù)訓(xùn)練模型，并通過實(shí)際示例演示如何使用這些模型進(jìn)行文本分類。我們將使用擁抱面轉(zhuǎn)換器庫來實(shí)現(xiàn)。

2023-06-14 09:30:14

293

芯生態(tài) I 持續(xù)拓展應(yīng)用空間兆芯CPU完成多款軟硬件適配

上海天數(shù)智芯半導(dǎo)體有限公司天垓100訓(xùn)練卡(BI-V100) 天垓100聚焦高性能、通用性和靈活性，支持200余種人工智能模型，支持通用計算、科學(xué)計算、大模型、支持業(yè)界前沿新算法模型。模型適配速度快，從容面對未來的算法變遷，為人工智能及通用計

2023-06-12 16:15:02

515

天數(shù)智芯天垓100率先完成百億級參數(shù)大模型訓(xùn)練

的Aquila語言基礎(chǔ)模型，使用代碼數(shù)據(jù)進(jìn)行繼續(xù)訓(xùn)練，穩(wěn)定運(yùn)行19天，模型收斂效果符合預(yù)期，證明天數(shù)智芯有支持百億級參數(shù)大模型訓(xùn)練的能力。在北京市海淀區(qū)的大力支持下，智源研究院、天數(shù)智芯與愛特云翔共同合作，聯(lián)手開展基于自主通用GPU的

2023-06-12 15:23:17

550

摩爾線程率先完成對“悟道·天鷹”大模型的推理兼容適配

? 6月，智源研究院在北京智源大會上重磅發(fā)布了全面開源的“悟道3.0”系列大模型，包括“悟道·天鷹”（Aquila）語言大模型等領(lǐng)先成果。目前，摩爾線程已率先完成對“悟道·天鷹”（Aquila

2023-06-12 14:30:22

1182

天數(shù)智芯通用GPU產(chǎn)品為大模型時代提供強(qiáng)大算力底座

，全面介紹了天數(shù)智芯基于自研通用GPU的全棧式集群解決方案及其在支持大模型上的具體實(shí)踐。 天數(shù)智芯產(chǎn)品線總裁鄒翾鄒翾指出，順應(yīng)大模型的發(fā)展潮流，天數(shù)智芯依托通用GPU架構(gòu)，從訓(xùn)練和推理兩個角度為客戶提供支撐，全力打造高性

2023-06-08 22:55:02

951

圖解大模型訓(xùn)練之：Megatron源碼解讀2，模型并行

前文說過，用Megatron做分布式訓(xùn)練的開源大模型有很多，我們選用的是THUDM開源的CodeGeeX（代碼生成式大模型，類比于openAI Codex）。選用它的原因是“完全開源”與“清晰的模型架構(gòu)和預(yù)訓(xùn)練配置圖”，能幫助我們高效閱讀源碼。我們再來回顧下這兩張圖。

2023-06-07 15:08:24

2186

如何將Pytorch自訓(xùn)練模型變成OpenVINO IR模型形式

本文章將依次介紹如何將Pytorch自訓(xùn)練模型經(jīng)過一系列變換變成OpenVINO IR模型形式，而后使用OpenVINO Python API 對IR模型進(jìn)行推理，并將推理結(jié)果通過OpenCV API顯示在實(shí)時畫面上。

2023-06-07 09:31:42

1057

State of GPT：大神Andrej揭秘OpenAI大模型原理和訓(xùn)練過程

因?yàn)樵?b class="flag-6" style="color: red">模型的訓(xùn)練時間明顯更長，訓(xùn)練了1.4 萬億標(biāo)記而不是 3000 億標(biāo)記。所以你不應(yīng)該僅僅通過模型包含的參數(shù)數(shù)量來判斷模型的能力。

2023-05-30 14:34:56

642

天數(shù)智芯取得大模型適配支持階段性成果

5月，上海市委網(wǎng)信辦楊海軍總工程師一行就大模型發(fā)展及應(yīng)用情況赴上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱“天數(shù)智芯”）調(diào)研考察，天數(shù)智芯副董事長蔡全根等陪同調(diào)研。

2023-05-26 11:33:19

861

自訓(xùn)練Pytorch模型使用OpenVINO?優(yōu)化并部署在AI愛克斯開發(fā)板

本文章將依次介紹如何將 Pytorch 自訓(xùn)練模型經(jīng)過一系列變換變成 OpenVINO IR 模型形式，而后使用 OpenVINO Python API 對 IR 模型進(jìn)行推理，并將推理結(jié)果通過 OpenCV API 顯示在實(shí)時畫面上。

2023-05-26 10:23:09

548

NVIDIA AI 技術(shù)助力 vivo 文本預(yù)訓(xùn)練大模型性能提升

vivo AI 團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)合作，通過算子優(yōu)化，提升 vivo 文本預(yù)訓(xùn)練大模型的訓(xùn)練速度。在實(shí)際應(yīng)用中， 訓(xùn)練提速 60% ，滿足了下游業(yè)務(wù)應(yīng)用對模型訓(xùn)練速度的要求。通過

2023-05-26 07:15:03

422

什么是預(yù)訓(xùn)練AI模型？

預(yù)訓(xùn)練 AI 模型是為了完成特定任務(wù)而在大型數(shù)據(jù)集上訓(xùn)練的深度學(xué)習(xí)模型。這些模型既可以直接使用，也可以根據(jù)不同行業(yè)的應(yīng)用需求進(jìn)行自定義。

2023-05-25 17:10:09

593

全系標(biāo)配超光影長焦，十代里程碑之作 OPPO Reno10 系列今日正式發(fā)布

OPPO 今日正式發(fā)布 Reno 十代里程碑之作 Reno10 系列新品。得益于 Reno 系列在輕薄美學(xué)和人像科技賽道的長期深耕，Reno10 系列創(chuàng)新地為用戶帶來一款兼具輕薄手感和大底潛望的人像輕旗艦。

2023-05-24 16:03:25

931

利用OpenVINO?部署HuggingFace預(yù)訓(xùn)練模型的方法與技巧

作為深度學(xué)習(xí)領(lǐng)域的 “github”，HuggingFace 已經(jīng)共享了超過 100,000 個預(yù)訓(xùn)練模型

2023-05-19 15:57:43

494

天數(shù)智芯與中國電子云完成產(chǎn)品兼容性認(rèn)證

近日，上海天數(shù)智芯半導(dǎo)體有限公司（以下簡稱“天數(shù)智芯”）與中電云數(shù)智科技有限公司（以下簡稱“中國電子云”）完成產(chǎn)品兼容性認(rèn)證。結(jié)論顯示：天數(shù)智芯的通用GPU天垓、智鎧系列加速卡在中國電子云專屬云平臺以及超融合產(chǎn)品上運(yùn)行穩(wěn)定，性能可靠，表現(xiàn)出良好的兼容性。

2023-05-17 14:50:49

1013

使用Alpaca-Lora進(jìn)行參數(shù)高效模型微調(diào)

在推理時，將左右兩部分的結(jié)果加到一起即可，h=Wx+BAx=(W+BA)x，所以，只要將訓(xùn)練完成的矩陣乘積BA跟原本的權(quán)重矩陣W加到一起作為新權(quán)重參數(shù)替換原始預(yù)訓(xùn)練語言模型的W即可，不會增加額外的計算資源。

2023-05-17 14:24:20

1623

NVIDIA DRIVE Hyperion樹立自動駕駛汽車開發(fā)平臺的安全里程碑

全球 50 多家車企共計部署了 800 多輛基于NVIDIA DRIVE Hyperion 自動駕駛汽車開發(fā)平臺和參考架構(gòu)打造的自動駕駛測試車輛。近日，該架構(gòu)于自動駕駛安全領(lǐng)域樹立了新的里程碑。

2023-05-10 14:55:01

879

RCC電源，很簡單的原理，電源發(fā)展史的里程碑，詳細(xì)分析（上）#硬聲創(chuàng)作季

電路分析電工技術(shù)

也許吧發(fā)布于 2023-04-25 14:01:30

天數(shù)智芯取得大模型適配支持階段性成果

在合作伙伴的大力支持和共同努力下，天數(shù)智芯自主算力集群方案不僅能夠有效支持OPT、LLaMa、GPT-2、CPM、GLM等主流AIGC大模型的Pretrain和Finetune，還適配支持了清華、智源、復(fù)旦等在內(nèi)的國內(nèi)多個研究機(jī)構(gòu)的開源大模型，取得了大模型適配支持階段性成果。

2023-04-23 14:19:39

938

使用eIQ門戶進(jìn)行訓(xùn)練時出現(xiàn)服務(wù)器錯誤如何解決?

我正在嘗試使用自己的數(shù)據(jù)集訓(xùn)練人臉檢測模型。此錯誤發(fā)生在訓(xùn)練開始期間。如何解決這一問題？

2023-04-17 08:04:49

程泰毅先生加入芯馳任CEO，與團(tuán)隊(duì)齊心共進(jìn)新征程

，五年不到的時間，完成智艙、智駕、智控三大方向、四個系列產(chǎn)品的順利流片、安全及可靠性驗(yàn)證和量產(chǎn)上車，目前已擁有260多家國內(nèi)外優(yōu)質(zhì)客戶，完成超百萬片上車的里程碑，成為國內(nèi)車規(guī)級核心芯片設(shè)計的引領(lǐng)者。芯

2023-04-14 14:01:22

基于4000萬公里量產(chǎn)車駕駛數(shù)據(jù)訓(xùn)練，參數(shù)規(guī)模1200億

DriveGPT 雪湖·海若的底層模型采用 GPT（Generative Pre-trained Transformer）生成式預(yù)訓(xùn)練大模型，與 ChatGPT 使用自然語言進(jìn)行輸入與輸出

2023-04-14 10:27:15

871

1024

已全部加載完成

搜索歷史

天垓100率先完成百億級參數(shù)大模型訓(xùn)練，天數(shù)智芯迎來新的里程碑

評論