仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型
3月6日一早,阿里云正式发布并开源全新推理模型通义千问QwQ-32B”在仅仅2个小时后,摩尔线程就迅速、高效地完成了适配,实现了Day0级支持!基于大语言模型高速推理框架vLLM、MTTransformer推理引擎部署的QwQ-32B,在摩尔线程GPU上的实际运行中,展现出了卓越的推理性能与稳定性,再次印证了摩尔线程MUSA架构的强大生态兼容性。从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本,在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。