热搜话题榜单

3分钟前更新

1 月之暗面Kimi智能助手升级：联网回复更快搜索支持引用溯源 110人在看 2 华为 Pura 70 Ultra / Pro 今日先锋开售 Pro+/标准版 4 月 22 日开售 12154人在看 3 昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测 13178人在看 4 百度发布智能计算操作系统万源支持77款大模型 14206人在看 5 百度推出AgentBuilder、AppBuilder、ModelBuilder三大开发工具 15330人在看
6 百度正式发布文心大模型4.0工具版 16741人在看 7 华为官宣P系列品牌升级为Pura：创造独特和现代美学设计 171212人在看 8 360智脑7B参数大模型正式开源最长支持约50万字输入 18221人在看 9 美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格 19186人在看 10 腾讯智影推出“动态漫画”功能输入文案即可生成AI漫画视频 110428人在看

共找到与“站长”相关的结果1条

用FP8训练大模型有多香？微软：比BF16快64%，省42%内存

低精度训练是大模型训练中扩展模型大小，节约训练成本的最关键技术之一。在这种背景下，尤其是当我们关注扩展至OpenAI提出的超级智能模型规模时，低精度训练是其中最有效且最关键的技术之一，其优势包括内存占用小、训练速度快，通信开销低。可预见，FP8低精度训练将成为未来大模型研发的新基建。

FP8 微软

加载更多

©CopyRight CHINAZ.COM - 闽ICP备08105208号