刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
今天凌晨1点,OpenAI开源了一个全新的AIAgent评测基准——PaperBench。这个基准主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖论文的复现,包括对论文内容的理解、代码编写以及实验执行等方面的能力。目前智能体的能力还无法超越人类。
不只iPhone、iPad能折:苹果专利曝光折叠Apple Watch!
据最新消息,苹果正在研究一种可折叠的AppleWatch设计,这意味着未来不仅能看到折叠iPhone和iPad,折叠AppleWatch也有可能成为现实。根据专利文件显示,苹果正在探索利用铰链设计,让AppleWatch的屏幕像折叠手机一样实现上下翻盖折叠,或者通过滑动结构来展开屏幕。值得注意的是,此前有传闻称首款折叠iPhone的售价可能高达2000至2500美元以上,如果苹果真的推出折叠AppleWatch,其�