谷歌 DeepMind 推出 AlphaGeometry:奥林匹克级几何AI系统
谷歌旗下的DeepMind研究团队最近推出了名为AlphaGeometry的人工智能系统,该系统在解决几何奥林匹克问题方面表现出色,几乎可与人类金牌得主相媲美。这一成就代表着在大学预科数学困难领域中复杂自动推理能力的显著进步。AlphaGeometry的发布标志着在计算机程序领域中首次实现了比IMO平均候选程序更有效地证明欧几里得平面几何定理的突破,推动了数学竞赛顶峰推理的自动化�
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
【新智元导读】当前的视觉模型哪个更好?Meta团队最新一波研究来了。如何根据特定需求选择视觉模型?ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较?来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。-CLIP模型具有较高的形状偏差,与其ImageNet精度相比,分类错误较少。
AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌推数学几何模型Alpha Geometry 解题能力接近奥数金牌选手
谷歌推出了新的面向数学几何领域的模型AlphaGeometry,数学几何能力已接近人类奥林匹克金牌选手的水平。特别值得一提的是:它的训练是基于合成数据不是现有的数据。这无疑将为未来人工智能的发展,尤其是对于解决大语言模型幻觉和语料不足的问题提供新的思路。
谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主
GoogleDeepMind发布了一个名为AlphaGeometry的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry在标准奥数时限内解决了25道。研究人员最近推出了FunSearch,它首次使用大型语言模型在数学科学的开放问题中取得了发现。
IBM以23亿美元收购数据集成平台webMethods和StreamSets
在数字化转型日益加速的今天,应用和数据集成方案在组织中扮演着愈发重要的角色。这两者是SoftwareAG的SuperiPaaS企业技术平台。两家公司与IBM的SuperiPaaS愿景一致,IBM全球的规模将进一步增强这些平台的能力。
Meta引入全新注意力机制Sytem 2 Attention 提升Transformer架构推理能力
Meta的研究者发表了一项关于Transformer架构的新研究,提出了一种名为System2Attention的全新注意力机制。该研究旨在解决大型语言模型在推理能力上的不足,特别是在处理复杂任务时可能出现的错误。S2A的引入为解决当前LLM推理能力不足的问题提供了一种创新性的解决方案。
Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话
MetaAI最近发布了MMCSG数据集,该数据集包含使用ProjectAria录制的25小时以上的双向对话。CHiME-8MMCSG任务的重点是转录使用智能眼镜录制的对话,这些眼镜配备了多个传感器,包括麦克风、摄像头和惯性测量单元。MMCSG数据集的提供为在动态现实环境中开发和评估转录系统提供了宝贵资源。
OpenAI推出“Meta-Prompting”,显著提升GPT-4等模型内容准确性
OpenAI、斯坦福大学的研究人员推出了一个创新大模型增强框架——Meta-ProMetating。Meta可增强GPT-4、PaLM和LLaMa等模型的性能,使生成的内容更加精准、安全可靠。指挥模型再根据这些反馈进行调整和修正并进行自适应学习,以生成更准确和可靠的最终答案。
苹果Vision Pro发售:竞争对手Meta单日大涨20%创纪录!
苹果的首款头显设备VisionPro在2月2日正式开售,但其竞争对手Meta的股价则是单日大涨超过20%,一天市值增加超过2000亿美元,创造了美股历史记录。2023年9月份,Meta公司发布了Quest3头显,售价为499.99美元起。并且将电池和VisionPro加在一起,总重量已超一公斤,相比之下,Quest3的重量为515克。
AI视野:Meta发布Code Llama70B;Nijijourney V6模型正式上线;Chrome将内置AI写作助手;Minimax的AI对话机器人海螺问问上线
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。在加入微软研究院之前,他曾在乔治亚理工学院和丰田工业大学芝加哥分校担任计算机科学助理教授。
Meta推机器人框架OK-Robot 机器人收拾房间就要实现了?
Meta和纽约大学合作开发的机器人框架OK-Robot,让我们离实现机器人收拾房间的目标又近了一步。这一新型开放知识型机器人框架融合了前沿的视觉语言模型来识别物体,预先训练好的机器人抓取模型,以及经过实战考验的算法,如1968年的A*算法用于导航。这一成果为机器人在家庭环境中执行日常任务提供了新的可能性。
字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA
过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。随着技术的进步,这些方法可能会进一步完善。
Meta AI团队再失大将:R-CNN作者Ross Girshick离职
Meta的FAIR团队再次迎来一位大佬级研究科学家的离职消息,R-CNN的作者RossGirshick决定离开Meta,加盟艾伦人工智能研究所。这也是近期FAIR团队内部的一系列离职动荡中的最新发展。这一系列的动荡也让业界对Meta在AI领域的发展保持关注,以期看到他们在人才留存和创新方面取得更多进展。
Meditron:先进的医学大语言模型
Meditron是一个基于Llama的大型医学语言模型,由Meta公司更新并发布。Meditron项目是完全开源的,包括数据、模型权重和配置,这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。在紧急情况下快速提供医疗响应,或在基础设施不足的地区辅助医疗工作,Meditron可以发挥重要作用。
MIT博士生用Vision Pro实时训练机器狗 开源项目Tracking Steamer火了
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
字节万卡集群技术细节公开:2天搞定GPT-3训练,算力利用率超英伟达Megatron-LM
随着对Sora技术分析的展开,AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注:文章披露,字节搭建起的万卡集群,能在1.75天内完成GPT-3规模模型的训练。剪映旗下类似Sora的AI视频工具已经启动邀请内测。
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。作者已经放出了所有代码,并将所有模型和实验脚本开源。
谷歌推AI音乐实验项目Instrument Playground 能模拟100多种乐器
谷歌最新实验性AI项目“InstrumentPlayground”已面世,允许人们通过一个文本提示生成20秒的音乐曲目。与Meta的MusicGen等类似项目相比,谷歌的版本声称能够模拟来自世界各地的100多种乐器,包括常见的钢琴和中国的笛子等。期待在未来看到更多的发展。