PyTorch 1.6 nightly增加了一個子模塊amp,支持自動混合精度訓練。值得期待。來看看性能如何,相比Nvidia Apex 有哪些優(yōu)勢?
A developer-friendly guide to mixed precision training with PyTorch
https://spell.run/blog/mixed-precision-training-with-pytorch-Xuk7YBEAACAASJam
即將在 PyTorch 1.6上發(fā)布的 torch.cuda.amp 混合精度訓練模塊實現(xiàn)了它的承諾,只需增加幾行新代碼就可以提高大型模型訓練50-60% 的速度。
-
模塊
+關(guān)注
關(guān)注
7文章
2785瀏覽量
49973 -
代碼
+關(guān)注
關(guān)注
30文章
4892瀏覽量
70422 -
pytorch
+關(guān)注
關(guān)注
2文章
809瀏覽量
13851
原文標題:訓練提速60%!只需5行代碼,PyTorch 1.6即將原生支持自動混合精度訓練
文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0
摩爾線程GPU原生FP8計算助力AI訓練

使用OpenVINO? 2021.4將經(jīng)過訓練的自定義PyTorch模型加載為IR格式時遇到錯誤怎么解決?
大模型訓練框架(五)之Accelerate
PyTorch GPU 加速訓練模型方法
如何在 PyTorch 中訓練模型
基于Pytorch訓練并部署ONNX模型在TDA4應(yīng)用筆記

評論