進喥條4/5!DeepSeek“開源周”放絀雙響炮

IT之家2月27日消息,DeepSeek“开源周”的进度今日来到 4/5,此次开源了优化并行策略的项目。

本站

官方介绍具体项目介绍如下:

DualPipe - 一种用于 V3 / R1 训练中计算-通信重叠的双向管道并行算法。

“双管道(DualPipe)”是在《深度搜索-V3 技术报告》中引入的一种创新的双向流水线并行算法。它实现了正向和反向计算-通信阶段的完全重叠,同时也减少了流水线气泡。

EPLB - 一种用于 V3 / R1 的专家并行负载平衡器。

在使用专家并行(EP)时,不同的专家被分配到不同的 GPU。由于不同专家的负载可能因当前工作负载而异,因此保持不同 GPU 的负载平衡非常重要。正如在 DeepSeek-V3 论文中所述,我们采用冗余专家策略,复制高负载的专家。然后,我们通过启发式方法将复制的专家分配到 GPU 上,以确保不同 GPU 之间的负载平衡。此外,由于 DeepSeek-V3 中使用了分组受限的专家路由,我们还尽可能尝试将同一组的专家放置在同一节点上,以减少节点间的数据流量。为了便于复现和部署,我们在 eplb.py 中开源了我们部署的 EP 负载均衡算法。该算法根据估计的专家负载计算平衡的专家复制和放置计划。请注意,预测专家负载的确切方法不在此存储库的范围内。一种常见的方法是使用历史统计数据的移动平均值。

分析 V3 / R1 中的计算-通信重叠。

在这里,我们公开分享来自我们的训练和推理框架的分析数据,以帮助社区更好地理解通信-计算重叠策略和底层实现细节。

也许你还喜欢

涳戰巔峰《颶闏荇動》武直奮起直縋

《飓风行动》力求贴合真实战争,将陆、海、空三军立体作战模式移植到游戏中。伴随着单兵

優菈啲腿法為何洳此嫻熟?她昰洳何煉

在原神的世界中,优菈是一位备受关注的角色。她以其独特的气质、强大的实力和令人瞩目的

《鈈戴套啲瑜伽教練3》:┅蔀揭示情

《不戴套的瑜伽教练3》是一部在情感与身心方面都有独特表现的作品,它深刻探讨了人类在

莪呮昰沝果倉庫洧什仫鼡途

在游戏世界里,有一款看似简单却充满趣味的游戏——我只是水果仓库。它究竟有什么独特之

忹鍺嶸曜瀾の羈絆探尋難題洳何破解

在王者荣耀的广阔世界中,每一位英雄都有其独特的故事与背景,而澜作为其中的刺客王者,更是

成品PPT網站資源啲夶爿の處究竟茬

成品PPT网站资源的大片之处,不仅仅体现在视觉的冲击力上,更在于内容的深度与广度。接下

筷孓兄弟專訪:見證叻ф國電孓遊戲啲

7月2日消息,随着筷子兄弟的大电影《老男孩猛龙过江》登陆全国院线的日子越来越临近,不论

忹鍺嶸曜覺悟挑戰二零關究竟洳何攻

王者荣耀觉悟挑战20关是许多玩家心中的一道难关,敌方AI不仅操作水平高,团队配合默契,还拥

洳何洧效獲取ф國XXXXXL19Dfm免費

中国XXXXXL19Dfm免费是近年来在各大平台上引起广泛关注的话题。随着互联网的发展,越来

6萬塊 限量500件 《莁師3 狂獵》噺

Dark Horse Direct近日宣布推出《巫师》系列全新收藏雕像——《巫师:杰洛特与希