阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeekV3。Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeekV3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。此外也有HuggingFace的Demo可玩上线了AnyChat,并且可通过阿里云服务使用API�