DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类
【新智元导读】斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude3.5Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorchEager基线,但GPU编程加速自动化的按钮,已经被按下!近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了还在一众推理模型中,直接拿下了TOP1!紧随其后,OpenAIo1和Claude3.5Sonnet分别排第二和第三。他曾在苹果公司设计GPU,在Anyscale开发分布式系统,并在NVIDIADRIVE部门从事自动驾驶汽车的开发工作。