色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產框架超越 PyTorch 和 TensorFlow?

人工智能與大數據技術 ? 來源:中國網科學 ? 作者:HyperAI超神經 ? 2021-04-09 15:11 ? 次閱讀

深度學習領域,PyTorch、TensorFlow 等主流框架,毫無疑問占據絕大部分市場份額,就連百度這樣級別的公司,也是花費了大量人力物力,堪堪將 PaddlePaddle 推入主流。

在這樣資源主導、肉食者謀的競爭環境下,一家國產深度學習框架的創業公司 OneFlow 出現了。

它以處理大規模模型見長,甚至今年將全部源碼和實驗對比數據,在 GitHub 進行了開源。

質疑不可避免的出現了:OneFlow 這種擅長解決大模型訓練的新架構有必要嗎?深度學習框架的效率有那么重要嗎?創業公司有可能在競爭中脫穎而出么?

我們借著 CosCon 20' 開源年會的機會,采訪了一流科技 CEO 袁進輝,了解到了他和一流科技的工程師們,1300 多個日日夜夜、數十萬行代碼背后的故事。

光環再多,創業也得一步一個腳印

2016 年 11 月,袁進輝在清華附近的一棟寫字樓里,寫下了 OneFlow 的第一版設計理念。此時的袁進輝剛剛從工作了近 4 年的微軟亞洲研究院(MSRA)離職。

「MSRA 前員工」并不是袁進輝身上唯一的 tag,2003 年從西安電子科技大學本科畢業后,他被保送到清華大學計算機系繼續直博學習,師從中國科學院院士、中國 AI 學科奠基人之一張鈸教授。

2008 年袁進輝從清華大學畢業后,先后加入網易、360 搜索。他開發的鷹眼系統,被中國國家隊作為日常訓練輔助系統。除此之外,他在 MSRA 工作期間,專注于大規模機器學習平臺,還研發出了當時世界上最快的主題模型訓練算法和系統 LightLDA,被應用于微軟在線廣告系統。

LightLDA 于 2014 年面世,僅僅兩年之后,獨具慧眼的袁進輝就又萌生了一個大膽地猜想:隨著業務需求和場景的豐富,能高效處理大模型訓練的分布式深度學習框架,必然成為繼 Hadoop、Spark 之后,數據智能時代基礎設施的核心。

但是當時主流的深度學習框架都是由 Google、Amazon、Facebook 等大廠牽頭開發的,即使是國內情況也類似。這由于開發深度學習框架不光需要雄厚的研發成本,更重要的是能耐得住寂寞,做好打持久戰的準備,因此尚沒有初創企業敢在該領域試水。

已有的深度學習框架都已經打的如火如荼了,一家初創企業,又搞出來一個新框架,會有用戶買單嗎?行動派袁進輝不但敢想,他還敢干。

敲下 OneFlow 第一行代碼的時候,他還沒想清楚詳細地實現策略,更談不上完善的業務邏輯。他的想法很簡單,又很復雜,要做一款「開發者愛用」的產品

一群天才+21 個月,OneFlow 初版上線

2017 年 1 月,袁進輝成立一流科技,召集了 30 多位工程師,開啟了 OneFlow 的正式「團戰」。盡管大家對困難已經做了充分預估,但是隨著開發的逐漸深入,涌現的重重困難還是出乎的團隊的意料。

深度學習框架的技術非常復雜,況且 OneFlow 采用了一個全新的技術架構,沒有先例可以參考,光是把技術設想跑通,就花了快兩年時間。

2018 年秋天,一流科技的發展進入了最艱難的階段。產品研發遲遲不能定型,一些員工的耐心跟信心消耗殆盡,加上公司下輪融資一波三折,團隊的士氣和信心面臨極大挑戰。

在創業圈有個「18 個月魔咒」的說法,意思是一年半沒看到希望,沒有正反饋,創業團隊的心態就會發生變化,失去耐心。袁進輝意識到,不能再等了,必須要盡早在真實場景去使用 OneFlow,讓大家看到 OneFlow 的創新的確是有價值的, 從而形成正反饋。

2018 年 9 月,在經歷了長達 1 年 9 個月的研發后,袁進輝和團隊推出了 OneFlow 閉源版。當時 OneFlow 還沒有開源,也存在大大小小的問題,但產品正式發布了,總算是給團隊成員吃了個定心丸。

專注大規模訓練,效率秒殺同類框架

2018 年 11 月,幸運之神降臨到一流科技。Google 推出了最強自然語言模型 BERT,開啟了 NLP 新時代。這驗證了袁進輝的預測,擅長處理大規模訓練的新架構,是必須且必要的。

很快,一流科技的工程師就基于 OneFlow 支持了 BERT-Large 的分布式訓練,這也是當時唯一一個支持分布式 BERT-Large 訓練的框架,性能和處理速度遠超已有的開源框架。

ce11a668-989f-11eb-8b86-12bb97331649.png

OneFlow 異構分布式流式系統架構圖

OneFlow 「一戰成名」,這也為一流科技積累第一批頭部互聯網企業用戶提供了契機。令人倍感意外的是,當時的袁進輝因為「仍對產品不滿意」,所以選擇了一條格外低調的路。

從 2018 年 9 月閉源版本發布,到 2020 年 7 月正式開源,袁進輝又用了 22 個月來打磨 OneFlow。他和團隊一邊持續優化經典模型,一邊解決原來沒預計到的問題,在袁進輝看來,哪怕是產品文檔沒做好,他都不會輕易把 OneFlow 推到臺面上。

2020 年 7 月 31 日,OneFlow 正式在 GitHub 開源。這個以訓練大規模模型著稱的開源框架,第二次站到聚光燈下,完美詮釋了四個字--效率為王。

ce2f9e70-989f-11eb-8b86-12bb97331649.png

深度學習框架版圖幾乎由美國企業主導

ce69eb84-989f-11eb-8b86-12bb97331649.png

國內開源的深度學習框架版圖中

只有 OneFlow 是由初創企業研發并開源

訓練速度更快、GPU 利用率更高、多機加速比更高、運維成本更低、用戶上手難度更低,五個強大優勢讓 OneFlow 能快速適應各個場景,并進行快速延展。袁進輝和團隊對 OneFlow 的性能追求和優化,達到了極致。

近期,OneFlow 發布了 v0.2.0 版本,更新的性能優化多達 17 個,使得 CNN 和 BERT 的自動混合精度訓練速度大幅提升。

開發團隊還建立了一個名為 DLPerf 的開源項目,將實驗環境、實驗數據、可復現算法完全開源,測評了在相同的物理環境上(4臺 V100 16G x8的機器),OneFlow 和其他幾個主流框架在 ResNet50-v1.5 和 BERT-base 模型上的吞吐率及加速比。

cf9ae314-989f-11eb-8b86-12bb97331649.png

7 個框架在 ResNet50-v1.5 模型上的吞吐率對比

結果證明 OneFlow 在單機單卡、多機多卡下的吞吐率都明顯領先其他框架,成為在主流旗艦顯卡(V100 16G)上訓練 ResNet50-v1.5 和 BERT-base 模型最快的框架,OneFlow ResNet50-v1.5 AMP 單卡比 NVIDIA 深度優化過的 PyTorch 快 80%, 比 TensorFlow 2.3 快 35%。

直面質疑,做賽道的「少數派」

事實上,OneFlow 從誕生至今,受到的質疑并不在少數,「上車晚且生存空間狹小」是最主流的聲音,對此袁進輝表現出了超乎尋常的坦然。

在他看來,深度學習框架本就是一個新生事物,技術和產業都在中早期,不存在上車早晚的問題。在技術收斂之前,性能高、易用性強、符合用戶使用價值的產品,就會受到用戶的青睞。

至于生存空間小一說,更是子虛烏有。開源讓小公司和大公司的產品有機會公平競技,優秀的新生框架挑戰權威的框架,正是開源精神的內核之一。

質疑聲并沒有阻礙 OneFlow 的發展,相反,袁進輝和團隊加快了 OneFlow 的升級和完善進程,更新優化性能、梳理開發者文檔、收集社區反饋……這些努力和堅持,為 OneFlow 吸引了更多用戶,其中不乏最初的「懷疑論者」。

在 COSCon'20中國開源年會上,袁進輝做了題為《深度學習訓練系統演進》的分享,向所有開發者介紹了 OneFlow 下一步的開發規劃,除了堅持效率為王、繼續性能優化外,開發團隊還在努力降低用戶的學習成本和遷移成本。目前 PyTorch 用戶遷移到 OneFlow 的成本已經相當低了,因為二者的用戶接口幾乎一樣,已訓練好的模型轉換成 OneFlow 的成本也足夠低。

客觀講,OneFlow 在完備性和易用性上,與 TensorFlow 和 PyTorch 相比還有差距。但是,OneFlow 的特色是效率高、擴展性好以及分布式特別容易使用,非常適合大規模人臉識別、大規模廣告推薦系統、以及類似 GPT-3 這種模型參數巨大的模型訓練場景。

采訪的最后袁進輝老師也毫不掩飾對人才的渴望,他表示 OneFlow 正在招聘機器學習工程師以及深度學習工程師,非常歡迎有識之士加入這個朝氣勃勃、渴望勝利的團隊。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 框架
    +關注

    關注

    0

    文章

    403

    瀏覽量

    17475
  • 開源
    +關注

    關注

    3

    文章

    3309

    瀏覽量

    42471
  • pytorch
    +關注

    關注

    2

    文章

    807

    瀏覽量

    13200
  • OneFlow
    +關注

    關注

    0

    文章

    9

    瀏覽量

    8802

原文標題:超越 PyTorch 和 TensorFlow,這個國產框架有點東西

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    PyTorch 2.5.1: Bugs修復版發布

    ? 一,前言 在深度學習框架的不斷迭代中,PyTorch 社區始終致力于提供更穩定、更高效的工具。最近,PyTorch 2.5.1 版本正式發布,這個版本主要針對 2.5.0 中發現的問題進行了修復
    的頭像 發表于 12-03 16:11 ?262次閱讀
    <b class='flag-5'>PyTorch</b> 2.5.1: Bugs修復版發布

    RK3568國產處理器 + TensorFlow框架的張量創建實驗案例分享

    一、實驗目的 本節視頻的目的是了解張量定義、了解張量的表示形式、并學習基于TensorFlow框架的張量創建方法。 二、實驗原理. 張量定義 1、張量是多維數組,這個定義常見于各種人工智能軟件。 2
    發表于 12-03 14:43

    pytorch和python的關系是什么

    PyTorch已經成為了一個非常受歡迎的框架。本文將介紹PyTorch和Python之間的關系,以及它們在深度學習領域的應用。 Python簡介 Python是一種高級、解釋型、通用的編程語言,由Guido van Rossu
    的頭像 發表于 08-01 15:27 ?1888次閱讀

    PyTorch深度學習開發環境搭建指南

    PyTorch作為一種流行的深度學習框架,其開發環境的搭建對于深度學習研究者和開發者來說至關重要。在Windows操作系統上搭建PyTorch環境,需要綜合考慮多個方面,包括軟件安裝、環境配置以及版本兼容性等。以下是一個詳細的
    的頭像 發表于 07-16 18:29 ?999次閱讀

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發的一個開源深度學習框架,它允許開發者方便地構建、訓練和部署各種復雜的機器學習模型。TensorFlow憑借其高效的計算性能、靈活的架構以及豐富的工具和庫,在學
    的頭像 發表于 07-12 16:38 ?658次閱讀

    基于PyTorch的卷積核實例應用

    在深度學習和計算機視覺領域,卷積操作是一種至關重要的技術,尤其在圖像處理和特征提取方面發揮著核心作用。PyTorch作為當前最流行的深度學習框架之一,提供了強大的張量操作功能和靈活的API,使得實現
    的頭像 發表于 07-11 15:19 ?447次閱讀

    pytorch如何訓練自己的數據

    本文將詳細介紹如何使用PyTorch框架來訓練自己的數據。我們將從數據準備、模型構建、訓練過程、評估和測試等方面進行講解。 環境搭建 首先,我們需要安裝PyTorch。可以通過訪問PyTorc
    的頭像 發表于 07-11 10:04 ?521次閱讀

    pytorch中有神經網絡模型嗎

    當然,PyTorch是一個廣泛使用的深度學習框架,它提供了許多預訓練的神經網絡模型。 PyTorch中的神經網絡模型 1. 引言 深度學習是一種基于人工神經網絡的機器學習技術,它在圖像識別、自然語言
    的頭像 發表于 07-11 09:59 ?692次閱讀

    tensorflowpytorch哪個更簡單?

    PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個易于使用、靈活且具有強大社區支持的框架Py
    的頭像 發表于 07-05 09:45 ?847次閱讀

    tensorflowpytorch哪個好

    tensorflowpytorch都是非常不錯的強大的框架TensorFlow還是PyTorch哪個更好取決于您的具體需求,以下是關于這
    的頭像 發表于 07-05 09:42 ?675次閱讀

    keras模型轉tensorflow session

    和訓練深度學習模型。Keras是基于TensorFlow、Theano或CNTK等底層計算框架構建的。TensorFlow是一個開源的機器學習框架,由Google Brain團隊開發。
    的頭像 發表于 07-05 09:36 ?511次閱讀

    TensorFlowPyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的一個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度學習框架扮演著至關重要的角色。TensorFlowPyTorch是目前最受歡迎的兩大深度
    的頭像 發表于 07-02 14:04 ?953次閱讀

    使用PyTorch構建神經網絡

    PyTorch是一個流行的深度學習框架,它以其簡潔的API和強大的靈活性在學術界和工業界得到了廣泛應用。在本文中,我們將深入探討如何使用PyTorch構建神經網絡,包括從基礎概念到高級特性的全面解析。本文旨在為讀者提供一個完整的
    的頭像 發表于 07-02 11:31 ?704次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發的用于機器學習和人工智能的軟件框架,其中最著名的是TensorFlowTensorFlow是一個開源的機器學習框架
    的頭像 發表于 03-01 16:25 ?870次閱讀

    中國人工智能框架的三個行業趨勢

    由于歷史和使用習慣的原因,TensorFlowPyTorch 在中國的知名度也領先于其他人工智能框架,分別排在前兩位。
    發表于 01-29 14:41 ?460次閱讀
    中國人工智能<b class='flag-5'>框架</b>的三個行業趨勢
    主站蜘蛛池模板: 接吻吃胸摸下面啪啪教程| 十分钟免费看完整视频| 青青草原国产在线观看| 天天国产在线精品亚洲| 伊人久久大香网| gay台湾无套男同志xnxⅹ| 国产成人免费观看| 精品国产免费第一区二区| 泡妞高手在都市免费观看| 亚洲 天堂 欧美 日韩 国产| 91桃色污无限免费看| 国产精品观看视频免费完整版| 久青草国产在线视频亚瑟影视| 日日射夜夜干夜夜插在线播放| 英国video性精品高清最新| 成年视频xxxxxx在线| 美女被触手注入精子强制受孕漫画 | 牛牛在线视频| 亚洲视频网站欧美视频网站| 边摸边吃奶边做带声音| 两个客户一起吃我的奶| 亚洲AV色香蕉一区二区三区| 超碰在线公开视频| 免费女人光着全身网站| 影音先锋亚洲AV少妇熟女| 国产精品成人A蜜柚在线观看| 欧美日韩久久久精品A片| 在线电台收听| 九色PORNY真实丨首页| 亚洲成人精品久久| 国产树林野战在线播放| 兽交白浆喷水高潮| 动漫美女的阴| 色欲AV精品人妻一二三区| 成人国产在线看不卡| 日本一本免费线观看视频| 苍老师刺激的120分钟| 青青热久久综合网伊人| xart欧美一区在线播放| 国产97视频在线观看| 好爽别插了无码视频|