谷歌云平臺今天宣布,自2018年2月12日起,Google獨家研制的Cloud TPU向公眾開放使用,幫助機器學習開發者快速訓練模型。
Cloud TPU是Google為TensorFlow專門設計的機器學習硬件加速器,基于4個特制的ASIC,單個Cloud TPU 的計算能力可達180 TFLOPS,同時具備64GB帶寬。
和其他GPU云一樣,Cloud TPU免去了設計、部署、維護一個機器學習計算集群的麻煩。除此之外,Cloud TPU的主要優勢在于容易和快速。
容易構建模型
TPU雖然基于ASIC構建,但并不像其他基于ASIC的機器學習硬件一樣需要專門編寫程序(其中包括很多和硬件交互的底層代碼)。相反,TPU可以直接使用高層的TensorFlow API。為了進一步幫助機器學習開發者快速上手,Google開源了一系列基于Cloud TPU的參考實現:
ResNet-50及其他流行的圖像分類模型
用于機器翻譯和語言建模的Transformer
以后Google還將陸續開源其他模型實現。
如果你想基于Cloud TPU優化自己的TensorFlow模型,Google也提供了文檔和工具。
另外,PyTorch作者,Facebook AI Research的Soumith Chintala也宣布打算在PyTorch框架中集成Cloud TPU支持。
快速訓練模型
當年AlphaZero訓練了不到24小時就擊敗了圍棋、國際象棋、將棋的最先進模型,而AlphaZero正是基于TPU訓練的。
現在,你也可以體驗TPU的速度了!按照Google提供的教程,不到一天、不到200美元,你就可以在ImageNet數據集上訓練ResNet-50至75%精確度。如果換成普通的GPU云,比如,配備Nvidia Tesla M40的阿里云,你需要多花1-2倍的錢,還需要等待兩周!
這還僅僅只是一個開始。Cloud TPU還可以通過專門的極速網絡連接,協同工作——Google稱之為TPU pod。等今年晚些時候Google開放TPU pod,訓練時間可以進一步縮減至不到30分鐘,而且無需改動代碼!
價格
Cloud TPU以秒計費,目前的價格為每小時6.50美元,以后可能會降價。目前Cloud TPU還處于Beta測試階段,因此主機位置只限美國中部地區,數量有限,需要先提交表單申請配額,還不能即買即用。
-
AI
+關注
關注
87文章
30731瀏覽量
268893 -
模擬訓練系統
+關注
關注
0文章
6瀏覽量
10061 -
機器學習技術
+關注
關注
0文章
7瀏覽量
2957
原文標題:Google Cloud TPU向公眾開放使用
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論