谷歌 DeepMind 推出 AlphaGeometry:奥林匹克级几何AI系统
谷歌旗下的DeepMind研究团队最近推出了名为AlphaGeometry的人工智能系统,该系统在解决几何奥林匹克问题方面表现出色,几乎可与人类金牌得主相媲美。这一成就代表着在大学预科数学困难领域中复杂自动推理能力的显著进步。AlphaGeometry的发布标志着在计算机程序领域中首次实现了比IMO平均候选程序更有效地证明欧几里得平面几何定理的突破,推动了数学竞赛顶峰推理的自动化�
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
【新智元导读】当前的视觉模型哪个更好?Meta团队最新一波研究来了。如何根据特定需求选择视觉模型?ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较?来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。-CLIP模型具有较高的形状偏差,与其ImageNet精度相比,分类错误较少。
AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌推数学几何模型Alpha Geometry 解题能力接近奥数金牌选手
谷歌推出了新的面向数学几何领域的模型AlphaGeometry,数学几何能力已接近人类奥林匹克金牌选手的水平。特别值得一提的是:它的训练是基于合成数据不是现有的数据。这无疑将为未来人工智能的发展,尤其是对于解决大语言模型幻觉和语料不足的问题提供新的思路。
谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主
GoogleDeepMind发布了一个名为AlphaGeometry的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry在标准奥数时限内解决了25道。研究人员最近推出了FunSearch,它首次使用大型语言模型在数学科学的开放问题中取得了发现。
IBM以23亿美元收购数据集成平台webMethods和StreamSets
在数字化转型日益加速的今天,应用和数据集成方案在组织中扮演着愈发重要的角色。这两者是SoftwareAG的SuperiPaaS企业技术平台。两家公司与IBM的SuperiPaaS愿景一致,IBM全球的规模将进一步增强这些平台的能力。
Meta引入全新注意力机制Sytem 2 Attention 提升Transformer架构推理能力
Meta的研究者发表了一项关于Transformer架构的新研究,提出了一种名为System2Attention的全新注意力机制。该研究旨在解决大型语言模型在推理能力上的不足,特别是在处理复杂任务时可能出现的错误。S2A的引入为解决当前LLM推理能力不足的问题提供了一种创新性的解决方案。
ICCV'23论文颁奖“神仙打架”!Meta分割一切和ControlNet共同入选,还有一篇让评委们很惊讶
计算机视觉巅峰大会ICCV2023,在法国巴黎正式“开奖”!今年的最佳论文奖,简直是“神仙打架”。获得最佳论文奖的两篇论文中,就包括颠覆文生图AI领域的著作——ControlNet。来自MIT的TedAdelson教授则获得了终身成就奖。
Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话
MetaAI最近发布了MMCSG数据集,该数据集包含使用ProjectAria录制的25小时以上的双向对话。CHiME-8MMCSG任务的重点是转录使用智能眼镜录制的对话,这些眼镜配备了多个传感器,包括麦克风、摄像头和惯性测量单元。MMCSG数据集的提供为在动态现实环境中开发和评估转录系统提供了宝贵资源。
OpenAI推出“Meta-Prompting”,显著提升GPT-4等模型内容准确性
OpenAI、斯坦福大学的研究人员推出了一个创新大模型增强框架——Meta-ProMetating。Meta可增强GPT-4、PaLM和LLaMa等模型的性能,使生成的内容更加精准、安全可靠。指挥模型再根据这些反馈进行调整和修正并进行自适应学习,以生成更准确和可靠的最终答案。
苹果Vision Pro发售:竞争对手Meta单日大涨20%创纪录!
苹果的首款头显设备VisionPro在2月2日正式开售,但其竞争对手Meta的股价则是单日大涨超过20%,一天市值增加超过2000亿美元,创造了美股历史记录。2023年9月份,Meta公司发布了Quest3头显,售价为499.99美元起。并且将电池和VisionPro加在一起,总重量已超一公斤,相比之下,Quest3的重量为515克。
AI视野:Meta发布Code Llama70B;Nijijourney V6模型正式上线;Chrome将内置AI写作助手;Minimax的AI对话机器人海螺问问上线
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。在加入微软研究院之前,他曾在乔治亚理工学院和丰田工业大学芝加哥分校担任计算机科学助理教授。
Meta推机器人框架OK-Robot 机器人收拾房间就要实现了?
Meta和纽约大学合作开发的机器人框架OK-Robot,让我们离实现机器人收拾房间的目标又近了一步。这一新型开放知识型机器人框架融合了前沿的视觉语言模型来识别物体,预先训练好的机器人抓取模型,以及经过实战考验的算法,如1968年的A*算法用于导航。这一成果为机器人在家庭环境中执行日常任务提供了新的可能性。
字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA
过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。随着技术的进步,这些方法可能会进一步完善。
Meta推AI视频模型Fairy,轻松替换视频人物、改变风格
Meta的GenAI团队推出了名为Fairy的视频到视频综合模型,该模型比现有模型更快,时间上更一致。研究团队展示了Fairy在几个应用中的表现,包括角色/物体替换,风格化和长形式视频生成。尽管存在这些问题,研究团队认为他们的工作在AI视频编辑领域代表了一次重大进展,具有对时间一致性和高质量视频合成的变革性方法。
Meta AI团队再失大将:R-CNN作者Ross Girshick离职
Meta的FAIR团队再次迎来一位大佬级研究科学家的离职消息,R-CNN的作者RossGirshick决定离开Meta,加盟艾伦人工智能研究所。这也是近期FAIR团队内部的一系列离职动荡中的最新发展。这一系列的动荡也让业界对Meta在AI领域的发展保持关注,以期看到他们在人才留存和创新方面取得更多进展。
Meta推大模型记忆增强方法MemWalker 靠prompt就能完成,无需额外训练
一项名为MemWalker的新技术,使大型语言模型能够克服其窗口长度的限制,从可以处理更长的文本并回答相关问题无需进行额外的训练。这一技术的开发团队使用了一种树形记忆策略,该策略的工作原理包括两个主要阶段:记忆树构建和导航检索。整个研究成果使大型语言模型在处理长文本方面迈出了重要一步。
MIT博士生用Vision Pro实时训练机器狗 开源项目Tracking Steamer火了
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
字节万卡集群技术细节公开:2天搞定GPT-3训练,算力利用率超英伟达Megatron-LM
随着对Sora技术分析的展开,AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注:文章披露,字节搭建起的万卡集群,能在1.75天内完成GPT-3规模模型的训练。剪映旗下类似Sora的AI视频工具已经启动邀请内测。