色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌基于TensorFlow構建了全球首個產品級可擴展的大規模移動端聯合學習系統

DPVg_AI_era ? 來源:lq ? 2019-02-13 10:14 ? 次閱讀

谷歌基于TensorFlow構建了全球首個產品級可擴展的大規模移動端聯合學習系統,目前已在數千萬臺手機上運行。這些手機能協同學習一個共享模型,所有的訓練數據都留在設備端,確保了個人數據安全,手機端智能應用也能更快更低能耗更新。研究人員表示,該系統有望在幾十億部手機上運行。

新年大手筆的不止是騰訊,谷歌近日宣布,他們實現了全球首個產品級的超大規模移動端分布式機器學習系統,目前已經能夠在數千萬部手機上運行。

DeepMind研究科學家Andrew Trask (他并未參與這項工作) 激動地在Twitter上說,這是2019年“年度最激動人心的論文之一”。

“谷歌公布了他們如何在數千萬臺手機上實現可擴展的聯合學習,數據安全隱私終于成真,而谷歌是這方面的領跑者!”

Andrew Trask說的,是谷歌日前在arxiv貼出的論文,“Towards Federated Learning at Scale:System Design”,論文描述了前面所說的全球首個產品級可擴展的聯合學習系統,以及該系統的高級設計和一些挑戰及其解決方案。

聯合學習(FL)是一種分布式機器學習方法,可以對保存在移動電話等設備上的大量分散數據進行訓練,是“將代碼引入數據,而不是將數據引入代碼”的更加通用化的一個實現,并解決了關于隱私、所有權和數據位置等基本問題。

作者在論文中寫道,“據我們所知,我們描述的系統是第一個產品級(production-level)的聯合學習實現,主要側重于在移動電話上運行的聯合平均算法(Federated Averaging algorithm)。

“我們的目標是將我們的系統從聯合學習推廣到聯合計算,聯合計算將遵循本文所述的相同基本原則,但不限于使用TensorFlow進行機器學習計算,而是通用的類似MapReduce的工作負載。

“我們看到的一個應用領域是聯合分析(Federated Analytics),它能讓我們監控大規模集群設備的統計數據,而無需將原始設備數據記錄到云中。”

谷歌不愧是谷歌,先不說這一技術本身的難度和實現難度,由此帶來的對智能云計算產業的沖擊,也可想而知!

谷歌提出“聯合學習”,實現可擴展的移動端分布式機器學習

2017年1月,統計機器學習先驅 Michael I. Jordan 在清華演講時指出,我們需要更好更大的分布式機器學習系統。

Jordan教授表示,在計算機科學中,數據點數量的增長是“復雜性”的來源,必須通過算法或者硬件來訓練,而在統計學中,數據點數量的增長是“簡單性”的來源,它能讓推理在總體上變得更強大,引出漸進式的結果。

“在形式層上,核心的統計學理論中缺乏計算機理論中的概念,比如‘runtime’的作用,而在核心的計算理論中又缺乏統計學概念,比如‘risk’的作用。二者之間的差異(Gap) 顯而易見。”Jordan教授說。

2017年4月,谷歌在官方博客中發文,介紹了他們提出的聯合學習(federated learning)。聯合學習也是一種機器學習,能夠讓用戶通過移動設備交互來訓練模型。

聯合學習能產生更智能的模型,更低的延時和更少的功耗,同時確保用戶的隱私。過程示意:(A)手機在本地根據你使用手機的方式將模型個性化,(B)許多用戶的更新會集中起來,(C)在云端形成針對一個共享模型的協同更新,然后不斷重復這個過程。來源:Google Blog

根據谷歌官博介紹,用戶的設備會下載一個當前模型,這個模型會從手機數據中學習不斷得到改善,然后將變化總結為一個小的關鍵更新。只有這個關鍵更新會以加密的方式被傳到云端,之后這一更新會在云端迅速被其他用戶對共享模型提交的更新平均化(averaged)。

簡單說,所有的訓練數據都留在用戶的設備上,而且上傳到云端的個別更新也不會存儲到云端。谷歌研究人員表示,新方法將機器學習與云端存儲數據的需求脫鉤,讓模型更聰明、延遲更低、更節能,而且保護用戶隱私不受威脅。

這一方法還有一個間接好處:除了實現共享模型的更新,用戶還能立刻使用改善后的模型,根據個人使用手機方式的不同,得到的體驗也會不同。

聯合學習僅當用戶設備處于閑置或充電狀態,并且使用無線網路的時候才發生,對用戶在移動端的使用體驗不會造成負面影響。來源:Google Blog

谷歌的研究人員開發了一個成熟的技術堆棧,確保聯合學習訓練僅當用戶設備處于閑置或充電狀態,并且使用無線網路的時候才發生。因此,具體的訓練對手機用戶體驗基本沒有什么影響。

當時,谷歌研究人員表示,他們正在安卓的谷歌鍵盤Gboard上測試聯合學習。例如,當鍵盤給出一個建議問詢時,手機就會在本地存儲相關信息,比如當前的文本,以及你是否點擊了相關建議。

聯合學習會在設備上處理這一過程,并對鍵盤問詢建議的迭代提出改善建議。來源:Google Blog

采用同步訓練算法,在數千萬臺手機上實現模型訓練和更新

現在,兩年過去,谷歌已經實現了首個產品級的聯合學習系統,并發布論文描述了這一系統的高級設計理念和現存挑戰。

像剛剛提到的安卓手機谷歌鍵盤查詢建議,也已經實現了大規模應用。

圖1:聯合學習流程

谷歌研究人員在論文中寫道,聯合學習基礎架構的基本設計決策的關鍵問題,是重點關注異步還是同步訓練算法。雖然之前很多關于深度學習的成果都采用了異步訓練方式,但最近出現了采用大批量同步訓練的趨勢。

再考慮到能夠增強聯合學習中保護隱私的方法,包括差異化隱私策略(McMahan等,2018)和安全聚合(Bonawitz等,2017),這些方法基本上需要一些固定設備上的同步后的概念,讓學習算法的服務器端可以僅消耗來自眾多用戶的更新信息的簡單聚合。

因此,谷歌研究人員選擇采用同步訓練方式。“我們的系統可以運行大批量SGD式算法和聯合平均算法,這是我們在生產中運行的主要算法”,算法的偽代碼如下:

論文描述的系統使用TensorFlow訓練深度神經網絡,對存儲在手機上的數據進行訓練。用聯合平均算法對訓練數據權重在云中相結合,構建一個全局模型,推送回手機上運行推理過程。安全聚合的實現能夠確保在全球范圍內,來自電話的個人更新是無法被窺視的。該系統已推向大規模應用,比如手機鍵盤上。

圖2:設備架構

解決多個實際問題,預計未來設備應用數量達數十億規模

谷歌研究人員表示,他們的方法解決了許多實際問題:即以復雜方式(如時區依賴性)解決了與本地數據分布相關的設備的可用性問題,應對不可靠的設備連接和執行中斷問題,在可用性存在差異的設備上對lock-step執行的編排問題,以及設備存儲空間和計算資源受限等問題。

這些問題在通信協議、設備和服務器級別都能得到解決。

“我們的研究已經足夠成熟,可以將系統部署到生產環境中,并解決數千萬個真實設備的應用學習問題;我們預計未來的設備應用數量將達到數十億的規模。”

圖3:聯合學習服務器架構中的構成要素

聯合學習方法在設備上的數據比服務器上存在的數據(比如設備首先生成數據)相關性更高、對隱私更敏感,或者不希望或不可能將數據傳輸到服務器的情況下是最佳的應用場景。聯合學習的目前多用于監督學習任務,通常利用的是從用戶活動中推斷出的標簽(比如點擊操作或鍵入的單詞等)。

設備上項目排名

移動應用程序中機器學習的一個常見用途,是從設備上的庫存中選擇和排序項目。例如,應用程序可以公開用于信息檢索或應用內導航的搜索機制,例如在Google Pixel設備上的搜索設置(ai.google,2018)。在設備上對搜索結果進行排序,可以免去對服務器的成本高昂的呼叫(原因可能是延遲、帶寬限制或高功耗),而且,關于搜索查詢和用戶選擇的任何潛在的隱私信息仍然保留在設備上。每個用戶與排名特征的交互可以作為標記數據點,可以在完整排序的項目列表中觀察用戶與其優先選項的交互信息。

移動設備鍵盤輸入內容建議

可以通過為用戶輸入的相關內容提供建議(比如與輸入文本相關的搜索查詢)來提升對用戶的價值。聯合學習可用于訓練機器學習模型來觸發建議功能,并對可在當前上下文中建議的項目進行排名。谷歌的Gboard移動鍵盤團隊就在使用我們的聯合學習系統,并采用了這種方法。

下一詞預測

Gboard還使用我們的聯合學習平臺訓練遞歸神經網絡(RNN)用于下一詞預測。該模型具有約140萬個參數,在經過5天的訓練后,處理了來自150萬用戶的6億個句子后,在3000輪聯合學習后實現收斂(每輪大約需要2-3分鐘)。該模型將基線n-gram模型最高召回率從13.0%提高到16.4%,并且其性能與經過1.2億步服務器訓練的RNN的性能相當。在實時對比實驗中,聯合學習模型的性能優于n-gram和服務器訓練的RNN模型。

結語

在論文中,谷歌研究人員詳細展示了在安卓手機上對此類算法的系統設計。

圖4:建模工程師的工作流程

同時,他們也指出,“這項研究目前仍處于早期階段,我們沒有解決所有問題,也無法全面討論所有必需的組件。

“我們在本文中要做的是,描述系統的主要組成部分以及面臨的挑戰,確定哪些問題沒有解決,希望這些工作能夠對更進一步的系統研究有所啟發。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6171

    瀏覽量

    105494
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132741
  • tensorflow
    +關注

    關注

    13

    文章

    329

    瀏覽量

    60537

原文標題:谷歌發布全球首個產品級移動端分布式機器學習系統,數千萬手機同步訓練

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發的一個開源深度學習框架,它允許開發者方便地構建、訓練和部署各種復雜的機器學習模型。TensorFlow
    的頭像 發表于 07-12 16:38 ?728次閱讀

    tensorflow和pytorch哪個好

    :2015年由Google Brain團隊發布。 語言支持 :主要使用Python,也支持C++、Java等。 設計哲學 :TensorFlow是一個的機器學習平臺,支持從研究
    的頭像 發表于 07-05 09:42 ?704次閱讀

    keras模型轉tensorflow session

    和訓練深度學習模型。Keras是基于TensorFlow、Theano或CNTK等底層計算框架構建的。TensorFlow是一個開源的機器學習
    的頭像 發表于 07-05 09:36 ?555次閱讀

    TensorFlow的定義和使用方法

    數據流圖,從而簡化機器學習模型的構建、訓練和部署。自2015年11月開源以來,TensorFlow迅速成為數據科學家、軟件開發者以及教育工作者廣泛使用的工具,廣泛應用于圖像識別、自然語言處理、推薦
    的頭像 發表于 07-02 14:14 ?802次閱讀

    TensorFlow與PyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的一個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度學習框架扮演著至關重要的角色。Tenso
    的頭像 發表于 07-02 14:04 ?982次閱讀

    CO2 AI推出首個大規模產品排放量計算解決方案

    (BCG)的2023年碳調查,只有38%的公司從供應商那里獲得足夠的產品級數據。 CO2 AI的解決方案提供了一種擴展的排放計算方法,遵循領先的行業標準,具有完全可追溯性和審計性。
    的頭像 發表于 06-29 09:30 ?624次閱讀

    其域創新發布Lixel CyberColor,為全球首個大場景3D高斯產品

    Lixel CyberColor(LCC)是全球首個商用的大場景3D高斯產品——,可以自動化生成超大規模的三維場景模型。除了影視級的逼真效
    的頭像 發表于 06-13 11:58 ?467次閱讀

    谷歌云部門進行大規模裁員

    谷歌云部門近日進行了大規模裁員,多個Cloud團隊的員工收到了工作取消的通知。據一名知情員工透露,盡管受影響員工的總人數尚未明確,但亞太地區“Go To Market”團隊約有100名員工被裁。
    的頭像 發表于 06-05 09:48 ?643次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發的用于機器學習和人工智能的軟件框架,其中最著名的是TensorFlowTensorFlow是一個開源的機器
    的頭像 發表于 03-01 16:25 ?900次閱讀

    中國電信規劃在上海建設首個國產超大規模算力液冷集群

    中國電信規劃建設首個國產超大規模算力液冷集群 人工智能技術的快速發展催生了巨大的算力需求;中國電信規劃在上海規劃建設支持萬億參數大模型訓練的智算集群中心。其中會搭載液冷技術,單池新建國產算力達10000卡,也是
    的頭像 發表于 02-22 18:48 ?1340次閱讀

    中國移動攜手10余家合作伙伴率先完成全球大規模RedCap現網試驗

    近日,中國移動攜手10余家合作伙伴率先完成全球大規模、最全場景、最全產業的RedCap(5G輕量化)現網規模試驗,推動首批芯片、終端具備商用條件,RedCap
    的頭像 發表于 02-19 15:55 ?792次閱讀

    中國移動完成全球大規模5G RedCap現網測試

    中國移動透露,通過此番試驗,他們成功查找并解決了包括無線信道低速、異系統廠家切換異常等近10項涉及上下游整合問題,提出并實施了多種BWP(部分帶寬)靈活擴張、用戶體驗無縫互操作強化等創新性解決方案,以適應各類大規模業務和高速
    的頭像 發表于 02-19 14:51 ?897次閱讀

    谷歌YouTube部門進行大規模內部調整,裁員約100人

    根據Tubefilter獲得的一份內部備忘錄,谷歌YouTube部門正在進行大規模的內部調整,其中包括裁員約100人。
    的頭像 發表于 01-18 18:29 ?1520次閱讀

    谷歌將進行大規模重組和裁員

    谷歌近日宣布對其硬件團隊進行大規模重組,包括Pixel、Nest和Fitbit在內的多個硬件部門將受到影響。同時,Google Assistant部門也將裁員數百人,而增強現實(AR)團隊的大多數員工也將面臨被解雇的命運。
    的頭像 發表于 01-12 15:06 ?782次閱讀

    如何使用TensorFlow構建機器學習模型

    在這篇文章中,我將逐步講解如何使用 TensorFlow 創建一個簡單的機器學習模型。
    的頭像 發表于 01-08 09:25 ?1005次閱讀
    如何使用<b class='flag-5'>TensorFlow</b><b class='flag-5'>構建</b>機器<b class='flag-5'>學習</b>模型
    主站蜘蛛池模板: 亚洲国产亚综合在线区尤物| 日本日本熟妇中文在线视频| 999人在线精品播放视频| 亚洲AV日韩AV欧美在线观看网 | 玩50岁四川熟女大白屁股直播| 男的插曲女的下面免费APP| 久久青草热热在线精品| 国内精品久久久久影院网站| 国产精品XXXXX免费A片| 高h原耽肉汁动漫视频| freehd另类xxxx喷水| 99re 这里只有精品| 边做边爱BD免费看片| 99亚洲精品色情无码久久| 2021扫黑风暴在线观看免费完整版| 亚洲乱妇88网| 亚洲精品视频免费在线观看| 影音先锋色av男人资源网| 一区二区三区内射美女毛片| 亚洲欧洲日产国码久在线| 亚洲精品久久久久69影院| 越南女 黑人 痛苦 大叫| 亚洲色t图| 97超级碰久久久久香蕉人人| 4484在线观看视频| 成人欧美一区二区三区白人| yin荡体育课羞耻play双性| yellow在线观看免费观看大全| 国产精品av| 久久天天躁狠狠躁夜夜躁| 日本aaaa| 神马老子影院午夜伦| 无遮挡午夜男女XX00动态| 亚洲 欧美 国产 伦 综合| 中文字幕一区中文亚洲| 99精品免费久久久久久久久日本| jjzz动漫| 好男人在线观看免费视频WWW| 精品久久久久久久久免费影院| 久久久国产精品免费A片3D| 免费高清毛片|