性能比4090快近一倍!RTX 5080/90最快年底发:英伟达要提高显卡平均售价
英伟达似乎已经准备就绪,计划在今年第四季度推出下一代GeForceRTX5090和RTX5080。这一举措将有助于英伟达的板卡合作伙伴扩大出货量,尤其是随着越来越多的玩家向高端升级,这些GPU的推出还将有助于提高GPU的平均销售价格。RTX5090的价格可能超过2500美元,约合人民币1.8万。
OpenAI新研究:让小模型来监督大模型能显著提高泛化性能
人工智能的超级对齐问题在未来AI系统超越人类智能的情境下变得尤为复杂。研究小模型是否能够有效监督大模型成为关键问题。期待研究者在这一领域取得更多的突破。
亚马逊的 Trainium2 AI 芯片配备 96GB HBM,训练性能提高四倍
本周,亚马逊网络服务推出了其新的人工智能加速器芯片Trainium2,相比其前身,它显著提升了性能,使AWS能够训练具有高达数万亿参数的基础模型和大型语言模型。AWS还为自己设定了一个宏伟目标,即使其客户能够为他们的工作负载访问高达65AIExaFLOPS的性能。我们与AWS的合作将帮助各种规模的组织解锁新的可能性,因为它们使用Anthropic的最先进AI系统与AWS的安全可靠云技术结合。
NVIDIA提出 Tied-Lora:提高LoRA方法的参数效率 用13%参数实现性能与标准LoRA方法相媲美
一组来自NVIDIA的研究人员近日提出了一种名为Tied-LoRA的新技术,旨在改善低秩适应方法的参数效率。该方法采用了权重绑定和选择性训练的策略,以寻找性能和可训练参数之间的最佳平衡。讨论与其他参数效率方法的限制和比较对于确定未来探索的潜在领域至关重要。
字节跳动利用AI对Linux内核进行优化 显著提高效率
TikTok母公司字节跳动近期在LinuxPlumbersConference上进行了技术演示,详细介绍了如何利用人工智能和机器学习对Linux内核进行优化。演示由字节跳动工程师CongWang主持,深入详尽,专为计算机工程师设计。字节跳动也强调,尽管机器学习和AI有巨大潜力,但在编写内核方面,真正的人类工程师短期内不太可能被计算机取代。
英伟达发布新一代AI处理器H200 性能较H100提高60%至90%
英伟达Nvidia推出了H200,这是一款专为训练和部署生成式人工智能模型的图形处理单元。它基于NVIDIAHopper架构,具有先进的内存和处理能力,可处理海量的数据用于生成式AI和高性能计算工作负载。对于高性能计算应用,内存带宽对于提高数据传输速度、减少处理瓶颈至关重要。
亚马逊研究人员推 Fortuna:提高模型预测准确性和量化不确定性能力
人工智能和机器学习领域的最新进展使人们的生活变得更加便利。凭借其令人难以置信的能力,人工智能和机器学习正在涉足各个行业并解决问题。Fortuna为模型预测的不确定性量化提供了一个一致的框架,无疑是机器学习领域中的一个有用的补充。