色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里云 & NVIDIA TensorRT Hackathon 2023 決賽圓滿收官,26 支 AI 團(tuán)隊(duì)嶄露頭角

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-10-17 03:20 ? 次閱讀

2023 年 9 月 29 日,由阿里云、NVIDIA 聯(lián)合主辦,阿里云天池平臺(tái)承辦的 “NVIDIA TensorRT Hackathon 2023 生成式 AI 模型優(yōu)化賽” 圓滿落幕。該賽事自 2020 年以來,已成功舉辦三屆,本屆賽事于今年 7 月啟動(dòng),吸引了來自全國(guó) 729 支開發(fā)者團(tuán)隊(duì)報(bào)名參賽,其中共有 40 支團(tuán)隊(duì)晉級(jí)復(fù)賽,最終 26 支團(tuán)隊(duì)于決賽中脫穎而出,分獲冠軍/亞軍/季軍及優(yōu)勝獎(jiǎng),展現(xiàn)出了卓越的技術(shù)實(shí)力。

掃碼查看獲獎(jiǎng)名單

wKgZomUuk2eAEL0HAAAE0HD1P50226.png

解鎖 NVIDIA TensorRT-LLM

挖掘生成式 AI 新需求

今年的 NVIDIA TensorRT Hackathon 著重提升選手開發(fā) NVIDIA TensorRT 應(yīng)用的能力。

在過去的一年里,生成式 AI 迎來了爆發(fā)式增長(zhǎng)。計(jì)算機(jī)能夠批量生成大量圖像和文本,有的甚至能夠媲美專業(yè)創(chuàng)作者的作品。這為未來生成式 AI 模型的發(fā)展鋪平了道路,令人充滿期待。正因如此,NVIDIATensorRT Hackathon 2023 選擇生成式 AI 模型作為比賽的主題,以激發(fā)選手的創(chuàng)新潛力。

今年的比賽設(shè)置了初賽和復(fù)賽兩組賽題——初賽階段,選手需要利用 TensorRT 加速帶有 ControlNet 的 Stable Diffusion pipeline,以優(yōu)化后的運(yùn)行時(shí)間和出圖質(zhì)量作為主要排名依據(jù);復(fù)賽為開放賽題,選手可自由選擇公開的 Transformer 模型,并利用 TensorRT 或 TensorRT-LLM 進(jìn)行模型推理優(yōu)化。

TensorRT作為 GPU 上的 AI 推理加速庫(kù),一直以來都備受業(yè)界認(rèn)可與青睞。本次比賽的背后是 NVIDIA TensorRT 開發(fā)團(tuán)隊(duì)對(duì)產(chǎn)品不斷進(jìn)行改進(jìn)和優(yōu)化的結(jié)果。通過讓更多模型能夠順利通過 ONNX 自動(dòng)解析得到加速,并對(duì)常見模型結(jié)構(gòu)進(jìn)行深度優(yōu)化,極大地提高了 TensorRT 的可用性和性能。這意味著大部分模型無需經(jīng)過繁瑣的手工優(yōu)化,就能夠在 TensorRT 上有出色的性能表現(xiàn)。

TensorRT-LLM是 NVIDIA 即將推出用于大語言模型推理的工具,目前已于官網(wǎng)開放試用(注意請(qǐng)使用公司郵箱申請(qǐng),暫不接受使用 Gmail、Yahoo、QQ 或其他個(gè)人電子郵箱提交的申請(qǐng),https://developer.nvidia.com/tensorrt-llm-early-access

作為此次復(fù)賽推薦使用的開發(fā)工具之一,TensorRT-LLM 包含 TensorRT 深度學(xué)習(xí)編譯器,并且?guī)в薪?jīng)過優(yōu)化的 CUDA kernel、前處理和后處理步驟,以及多 GPU/多節(jié)點(diǎn)通信,可以在 NVIDIA GPU 上提供出類拔萃的性能。它通過一個(gè)開源的模塊化 Python 應(yīng)用 API 提高易用性和可擴(kuò)展性,使開發(fā)人員能夠嘗試新的 LLM,提供最頂尖的性能和快速自定義功能,且不需要開發(fā)人員具備深厚的 C++ 或 CUDA 知識(shí)。

作為本次大賽的主辦方之一,阿里云天池平臺(tái)為參賽選手提供了卓越的云上技術(shù)支持,在阿里云 GPU 云服務(wù)器中內(nèi)置 NVIDIA A10 Tensor Core GPU,參賽者通過云上實(shí)例進(jìn)行開發(fā)和訓(xùn)練優(yōu)化模型,體驗(yàn)云開發(fā)時(shí)代的 AI 工程化魅力。同時(shí),由 NVIDIA 30 名工程師組成導(dǎo)師團(tuán)隊(duì),為晉級(jí)復(fù)賽的 40 支隊(duì)伍提供一對(duì)一輔導(dǎo)陪賽,助力選手獲得佳績(jī)。

從實(shí)踐到迭代

腦力與創(chuàng)造力的集中比拼

本次比賽中涌現(xiàn)出大量?jī)?yōu)秀的開發(fā)者。在獲獎(jiǎng)的 26 支團(tuán)隊(duì)中,有不少團(tuán)隊(duì)選擇借助 TensorRT-LLM 對(duì)通義千問-7B 進(jìn)行模型推理優(yōu)化。

通義千問-7B(Qwen-7B)是阿里云研發(fā)的通義千問大模型系列的 70 億參數(shù)規(guī)模的模型,基于 Transformer 的大語言模型,在超大規(guī)模的預(yù)訓(xùn)練數(shù)據(jù)上進(jìn)行訓(xùn)練得到。在 Qwen-7B 的基礎(chǔ)上,還使用對(duì)齊機(jī)制打造了基于大語言模型的 AI 助手 Qwen-7B-Chat。

獲得此次比賽一等獎(jiǎng)的“無聲優(yōu)化者(著)”團(tuán)隊(duì),選擇使用 TensorRT-LLM 完成對(duì) Qwen-7B-Chat 實(shí)現(xiàn)推理加速。在開發(fā)過程中,克服了 Hugging Face 轉(zhuǎn) Tensor-LLM、首次運(yùn)行報(bào)顯存分配錯(cuò)誤、模型 logits 無法對(duì)齊等挑戰(zhàn)與困難,最終在優(yōu)化效果上,吞吐量最高提升了 4.57 倍,生成速度最高提升了 5.56 倍

而獲得此次賽事二等獎(jiǎng)的“NaN-emm”團(tuán)隊(duì),在復(fù)賽階段,則選擇使用 TensorRT-LLM 實(shí)現(xiàn) RPTQ 量化。RPTQ 是一種新穎的基于重排序的量化方法,同時(shí)量化了權(quán)重與中間結(jié)果(W8A8),加速了計(jì)算。從最開始不熟悉任何 LLM 模型,到后續(xù)逐步學(xué)習(xí)和了解相關(guān)技術(shù),“NaN-emm”團(tuán)隊(duì)啟用了GEMM plugin,GPT Attention plugin,完成了 VIT、Q-Former、Vicuna-7B 模型的轉(zhuǎn)化,最終通過 40 個(gè)測(cè)試數(shù)據(jù),基于 Torch 框架推理耗時(shí) 145 秒,而經(jīng)過 TensorRT-LLM 優(yōu)化的推理引擎耗時(shí)為 115 秒

本次大賽還涌現(xiàn)了一批優(yōu)秀的開發(fā)者,本屆參賽選手鄧順子不僅率領(lǐng)隊(duì)伍獲得了一等獎(jiǎng),還收獲了本次比賽唯一的特別貢獻(xiàn)獎(jiǎng)。他表示,2022 年的 Hackathon 比賽是他首次接觸 TensorRT,這使他對(duì)模型推理加速產(chǎn)生了濃厚的興趣。盡管當(dāng)時(shí)未能進(jìn)入復(fù)賽,但那次經(jīng)歷讓他深感自身技能的不足。在上一次比賽中,他目睹了頂尖選手使用 FasterTransformer 在比賽中取得領(lǐng)先地位,這一經(jīng)歷讓他對(duì) AI 技術(shù)有了更深入的理解和追求。隨后,他積極做 TensorRT 上的模型開發(fā),特別是對(duì) ChatGLM/Bloom 等新興模型進(jìn)行了優(yōu)化,感受到了 TensorRT 的強(qiáng)大。

今年,他再次參加了 NVIDIA TensorRT Hackathon 2023,利用 TensorRT-LLM 成功優(yōu)化了 QWen 大模型,實(shí)現(xiàn)了自己的夢(mèng)想。他感謝主辦方給予的機(jī)會(huì),團(tuán)隊(duì)的支持,以及所有參賽者的努力,他期待未來能與大家一起為 AI 技術(shù)的發(fā)展創(chuàng)造更多奇跡。

人工智能應(yīng)用場(chǎng)景創(chuàng)新日新月異,AI 模型的開發(fā)與部署也需要注入新的動(dòng)能。在此次賽事中,選手們基于 TensorRT 挖掘出更多的潛能和功能需求。未來,阿里云和 NVIDIA 還將持續(xù)為開發(fā)者和技術(shù)愛好者提供展示技能和創(chuàng)意的平臺(tái),天池平臺(tái)將與更多優(yōu)秀的開發(fā)者一同推進(jìn) TensorRT 的發(fā)展,讓 AI 在 GPU 上更容易、更高效地部署。

*本文中圖片來源于阿里云,若您有任何疑問或需要使用本文中圖片,請(qǐng)聯(lián)系阿里云。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息

wKgZomUuk2eADMjaAAFtccdApf0905.jpg


原文標(biāo)題:阿里云 & NVIDIA TensorRT Hackathon 2023 決賽圓滿收官,26 支 AI 團(tuán)隊(duì)嶄露頭角

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3771

    瀏覽量

    90991

原文標(biāo)題:阿里云 & NVIDIA TensorRT Hackathon 2023 決賽圓滿收官,26 支 AI 團(tuán)隊(duì)嶄露頭角

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    2024 AI+硬件創(chuàng)新大賽獲獎(jiǎng)名單出爐

    此前,2024年11月30日,由開放源子開源基金會(huì)主辦,魔搭社區(qū)、英特爾與阿里共同承辦的“AI+硬件創(chuàng)新大賽”總決賽在杭州圓滿落幕。本次大
    的頭像 發(fā)表于 12-09 16:01 ?229次閱讀

    一種創(chuàng)新L型電子墨水屏桌牌嶄露頭角

    隨著科技日新月異,商品或展品的信息展示方式也在不斷革新。在高價(jià)值商品、博物館、藝術(shù)展覽、科技產(chǎn)品或零售店中,一種創(chuàng)新的L型電子墨水屏桌牌正悄然嶄露頭角。它憑借簡(jiǎn)約大氣的外觀和靈活的智能刷新功能,將成為未來專業(yè)顯示的“潛力之星”。
    的頭像 發(fā)表于 11-28 14:36 ?226次閱讀

    MS39233驅(qū)動(dòng)IC方案在臺(tái)技術(shù)領(lǐng)域嶄露頭角

    在當(dāng)今科技飛速發(fā)展的時(shí)代,臺(tái)技術(shù)作為眾多領(lǐng)域的關(guān)鍵支撐,不斷追求更高的性能和更優(yōu)的解決方案。其中,MS39233 無刷直流馬達(dá)(BLDC)驅(qū)動(dòng) IC 方案以其獨(dú)特的優(yōu)勢(shì),在臺(tái)技術(shù)領(lǐng)域嶄露頭角
    的頭像 發(fā)表于 09-12 18:04 ?274次閱讀

    阿里巴巴季報(bào)出爐 阿里二季度營(yíng)增長(zhǎng)6%

    調(diào)整EBITA利潤(rùn)達(dá)到450.35億。阿里巴巴的季度經(jīng)營(yíng)業(yè)績(jī)超出市場(chǎng)預(yù)期。AI則是一個(gè)大亮點(diǎn);AI正推動(dòng)阿里重回增長(zhǎng)。
    的頭像 發(fā)表于 08-16 16:45 ?494次閱讀

    生成式AI與傳統(tǒng)AI的主要區(qū)別

    隨著人工智能技術(shù)的飛速發(fā)展,生成式AI(Generative AI)逐漸嶄露頭角,并與傳統(tǒng)AI(也稱為“規(guī)則驅(qū)動(dòng)的AI”或“判別式
    的頭像 發(fā)表于 07-05 17:35 ?2568次閱讀

    生成式AI醫(yī)療嶄露頭角:Meta Llama 3 NIM引數(shù)十公司關(guān)注

    NVIDIA NIM推理微服務(wù)在ai.nvidia.com網(wǎng)站上供大家下載。這使得醫(yī)療健康開發(fā)者、科研人員及企業(yè)能在各類應(yīng)用中合理創(chuàng)新,而NIM則支持各種標(biāo)準(zhǔn)應(yīng)用編程接口的部署,使用起來相當(dāng)靈活方便。
    的頭像 發(fā)表于 06-07 15:25 ?1536次閱讀

    蘋果新款iPad搭載OLED屏與AI芯片,爭(zhēng)奪AI PC新市場(chǎng)

    蘋果還推出了新型OLED iPad Pro,搭載專為人工智能(AI)計(jì)算設(shè)計(jì)的M4芯片。此舉顯示出蘋果既意在瓜分PC市場(chǎng),又欲在AI PC競(jìng)爭(zhēng)中嶄露頭角
    的頭像 發(fā)表于 05-27 17:42 ?817次閱讀

    佰維存儲(chǔ)榮獲“2023年度南山區(qū)專精特新企業(yè)增加值十強(qiáng)”

    近日,備受矚目的2023年度南山區(qū)經(jīng)濟(jì)突出貢獻(xiàn)企業(yè)TOP峰會(huì)圓滿落幕。在這場(chǎng)被譽(yù)為南山企業(yè)界“奧斯卡”的盛會(huì)上,深圳佰維存儲(chǔ)科技股份有限公司再次嶄露頭角,榮獲“2023年度南山區(qū)專精特
    的頭像 發(fā)表于 05-11 14:40 ?779次閱讀

    UWB技術(shù)是如何打破傳統(tǒng)技術(shù)局限的?

    在制造業(yè)領(lǐng)域,超寬帶(UWB)技術(shù)已嶄露頭角,成為產(chǎn)品和部件定位的革命性工具,提供無與倫比的精確度。
    的頭像 發(fā)表于 05-07 14:03 ?479次閱讀
    UWB技術(shù)是如何打破傳統(tǒng)技術(shù)局限的?

    瑞薩電子推出AI攝像頭模塊

    在全球智能化的大潮中,AI攝像頭模塊正嶄露頭角,以其出色的功能和廣泛的應(yīng)用領(lǐng)域,成為推動(dòng)智能化進(jìn)程不可或缺的核心組件。如今,無論是構(gòu)建智慧城市、打造智能家居,還是推動(dòng)工廠自動(dòng)化,AI技術(shù)都成為了提升效率、降低人力成本的關(guān)鍵。
    的頭像 發(fā)表于 03-22 11:38 ?849次閱讀

    知聲推進(jìn)港股IPO!AI解決方案收入排名中國(guó)第四,2023年?duì)I破7億

    于2012年,當(dāng)時(shí)國(guó)內(nèi)的AI產(chǎn)業(yè)剛剛萌芽,它率先開啟AGI技術(shù)商業(yè)化。在成立僅三個(gè)月后,知聲便發(fā)布了語音識(shí)別公有,在AI行業(yè)迅速嶄露頭角
    的頭像 發(fā)表于 03-22 00:12 ?3523次閱讀
    <b class='flag-5'>云</b>知聲推進(jìn)港股IPO!<b class='flag-5'>AI</b>解決方案收入排名中國(guó)第四,<b class='flag-5'>2023</b>年?duì)I<b class='flag-5'>收</b>破7億

    Open RAN的未來及其對(duì)AT&amp;amp;T的意義

    3月14日消息,在“Connected America 2024”會(huì)議上,AT&amp;T高級(jí)副總裁兼網(wǎng)絡(luò)首席技術(shù)Yigal Elbaz討論了Open RAN 的未來及其對(duì)AT&amp;T的意義。
    的頭像 發(fā)表于 03-14 14:40 ?735次閱讀

    高分子材料在光伏領(lǐng)域的主要應(yīng)用特點(diǎn)有哪些?

    隨著全球?qū)稍偕茉葱枨蟮募眲≡鲩L(zhǎng),太陽能作為一種清潔、可持續(xù)的能源正嶄露頭角
    的頭像 發(fā)表于 03-13 10:42 ?895次閱讀

    2024 AI智算產(chǎn)業(yè)趨勢(shì)報(bào)告

    當(dāng)下智算時(shí)代雖然在初級(jí)階段,依托AI大模型形成的新一代算力基礎(chǔ)設(shè)施和AI應(yīng)用已經(jīng)在諸多領(lǐng)域嶄露頭角。 數(shù)字中國(guó)愿景的實(shí)現(xiàn),基石在于夯實(shí)數(shù)字化基礎(chǔ)設(shè)施建設(shè)。
    發(fā)表于 01-17 09:40 ?491次閱讀
    2024 <b class='flag-5'>AI</b>智算產(chǎn)業(yè)趨勢(shì)報(bào)告

    2024年:AI技術(shù)投資嶄露頭角,微軟引領(lǐng)市場(chǎng)變革

    隨著生成式人工智能(GenAI)的崛起,2023年成為了這一技術(shù)的熱議之年。然而,2024年將見證大多數(shù)公司向這一技術(shù)進(jìn)行實(shí)質(zhì)性投入。
    的頭像 發(fā)表于 12-26 16:54 ?791次閱讀
    主站蜘蛛池模板: 亚洲精品国产在线观看| 欧美色图14p| 97国产精品久久精品国产| 嗯别插太快好深再深点| yellow日本动漫观看免费| 色男人的天堂久久综合| 国产午夜小视频| 伊人国产在线观看| 美妇教师双飞后菊| 波野结衣qvod| 婷婷综合久久狠狠色| 寂寞护士中文字幕 mp4| 18禁黄无遮挡禁游戏在线下载| 欧美亚洲另类热图| 国产精品丰满人妻AV麻豆| 亚洲欧美日本中文子不卡| 迈开腿让我看下你的小草莓声音| www精品一区二区三区四区| 我们中文在线观看免费完整版| 果冻传媒在线观看完整版免费| 中文字幕爆乳JULIA女教师| 亲胸揉胸膜下刺激视频在线观看| 国产成人精品视频免费大全| 一品探花论坛| 妻子的妹妹在线| 国产喷水1区2区3区咪咪爱AV| 在线a视频| 日本老妇一级特黄aa大片| 国产亚洲精品久久久999密臂| 综合色就爱涩涩涩综合婷婷| 日本一卡2卡3卡四卡精品网站| 国产在线精品亚洲一品区| 1819sextub欧美中国| 色综合 亚洲 自拍 欧洲| 精品三级在线观看| GOGOGO高清在线播放韩国| 小sao货ji巴cao死你视频| 美女被日出水| 国产乱人偷精品视频A人人澡| 在线中文字幕| 射漂亮黑b丝女|