HuggingFace推出最大的开放合成数据集Cosmopedia 250亿个tokens
HuggingFace推出了Cosmopediav0.1,这是最大的开放合成数据集,由Mixtral7b生成,包含超过3000万个样本,总共约250亿个标记tokens。数据集旨在通过映射来自网页数据集如RefinedWeb和RedPajama的信息来汇编全球知识,包括教科书、博客文章、故事和WikiHow文章等各种内容类型。其目标是通过量身定制提示风格和受众,最大程度地提高多样性,从显著减少重复内容。
AMD 和 NVIDIA 计划在2025年左右推出面向 Windows PC的 ARM 芯片
图形芯片制造商NVIDIA和AMD都计划推出面向运行Windows操作系统的个人电脑的基于ARM架构的中央处理器。这一举措可能会在2025年前后实施。这场竞争有望推动个人电脑的整体技术进步。