幻方DeepSeek-V2系列模型已在魔搭社区开源
魔搭ModelScope社区宣布,DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。幻方公司在5月6日推出了第二代MoE模型DeepSeek-V2,并开源了技术报告和模型权重,该模型引入了MLA架构和自研Sparse结构DeepSeekMoE,以236B总参数、21B激活,实际部署在8卡H800机器上,输入吞吐量超过每秒10万tokens输出超过每秒5万tokens。DeepSeek-V2的推理代码和模型下载链接已经在魔搭ModelScope社区开源,用户可以通�