DeepSeek R1也会大脑过载?过度思考后性能下降,少琢磨让计算成本直降43%
大型推理模型像人一样,在「用脑过度」也会崩溃,进行动能力下降。加州大学伯克利分校、UIUC、ETHZurich、CMU等机构的研究者观察到了这一现象,他们分析了LRM在执行智能体任务过程中存在的推理-行动困境,并着重强调了过度思考的危险。这种不相关性可能是因为过度思考行为更多地受到模型的架构设计和训练方法的影响不是其上下文能力。