微軟推出ZeRO++技術 可顯著減少AI大模型訓練時間和成本|天天新動態(tài)

發(fā)布時間:2023-06-28 10:57:46
編輯:
來源:科技頭條
字體:

(資料圖片)

據微軟官方消息,微軟研究人員日前推出了名為 ZeRO++ 的新技術,可顯著減少大模型訓練時間和成本。

ZeRO++ 建立在 ZeRO 傳輸技術基礎上,提供增強的通信策略,可提高訓練效率,同時減少訓練時間和成本。ZeRO++ 可對權重進行量化,其利用基于塊的量化方法來保持訓練精度,這種優(yōu)化的量化過程相對原始 Zero 傳輸技術更快更準確。

微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達 4 倍的通信量,提高了訓練吞吐量和效率。

標簽: 人工智能 大模型訓練 大數據模型訓練

   原標題:微軟推出ZeRO++技術 可顯著減少AI大模型訓練時間和成本|天天新動態(tài)

>更多相關文章
最近更新