DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
【新智元导读】DeepMind的研究人员发现,LLM有一个天生的缺陷——在推理过程中无法通过自我纠正获得更好的回复,除非数据集中预设了真值标签。马库斯又高兴地转发了这篇论文。为了公平比较,应在事前和事后提示上投入同等的努力。
百度智能云宣布支持Llama3全系列训练推理
4月19日,百度智能云千帆大模型平台在国内首家推出针对Llama3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型,现已开放邀约测试。百度智能云千帆大模型平台中各种尺寸模型定制工具ModelBuilder已预置了最全面最丰富的大模型,支持国内外第三方主流模型,总数量达到79个,是国内拥有大模型数量最多的开发平台。4月18日,Meta正式发布Llama3,包括8B和70B参数的大模型,官方号称有史以来最强大的开源大模型。
报告称:OpenAI和Meta即将发布具有人类推理能力的AI模型
OpenAI和Meta据称正在准备发布更先进的AI模型,这些模型将能够帮助解决问题并承担更复杂的任务。OpenAI的首席运营官BradLightcap告诉《金融时报》,公司下一个版本的GPT将在解决"困难问题"方面取得进展,例如推理。马斯克表示,"有感知计算的总量"——这个概念可能指的是AI独立思考和行动——将在五年内超过所有人类。
fal官网体验入口 生成式媒体模型AI推理工具使用地址
fal是一个生成式媒体平台,旨在为开发者提供最先进的生成式媒体模型,并通过fal的推理专家优化,实现闪电般快速的推理。该平台支持实时WebSocket推理基础设施,并提供私有部署选项,以最经济的方式根据使用量付费。开发者可通过fal灵活的计费方式,实现经济高效的生成式媒体应用。
FireworksAI官网体验入口 AI应用开发模型推理平台使用地址
Fireworks-AI与世界领先的生成式AI研究人员合作,以最快速度提供最佳模型。拥有经Fireworks精心筛选和优化的模型,以及企业级吞吐量和专业的技术支持。要了解更多详细信息并开始您的AI推理之旅,请访问Fireworks-AI官方网站。
北大发布新图像生成框架VAR 推理速度提高20倍
北京大学最近发布了一种新的图像生成框架,名为VAR。这一突破性的技术首次使GPT风格的自回归模型在图像生成上超越了扩散transformer,同时展现出了与大语言模型观察到的类似Scalinglaws的规律。VAR算法为计算机视觉中的自回归算法设计提供了新的见解,有望推动这一领域的进一步发展。
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%
小孩子都会的脑筋急转弯推理题,GPT-4和Claude3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude3几乎达到百分百的正确率。我只是互联网上的一名普通人经常犯错。
通义千问开源新Qwen1.5-32B模型 推理速度更快,成本更低
通义千问近期开源了新的Qwen1.5-32B模型,该模型在语言理解、支持多语言、编程和数学能力方面表现出色。Qwen1.5-32B模型不仅支持多语言融合了GQA技术,使得模型在推理方面的效率更高,同时降低了部署成本。Qwen1.5-32B模型的开源将为语言理解和推理技术的发展带来重大影响,为解决复杂问题提供了更加强大的工具和资源。
研究发现:GPT-4在临床推理中表现优于医生,但也更经常出错
在一项新研究中,美国贝斯以色列医疗中心的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的IDEA评分,这是一种常用工具,用于评估临床推理能力。尽管这些AI系统还没有准备好用于临床诊断,但仍可能利用这项技术来增强临床工作流程,特别是在保持人类控制的同时确保安全、准确的过程。
马斯克即将发布Grok-1.5,推理能力更强
3月29日,马斯克旗下的AI公司x.ai在官网宣布,未来几天内即将发布Grok-1.5。x.ai开源了Grok-1的权重和网络架构,成为大模型开源领域的一匹黑马。训练数据方面,Grok-1发布版本所使用的训练数据截至2023年第三季度的互联网数据以及xAI人工智能导师提供的数据。
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。每次只需要一个查询获得相似性能的集成方法需要40倍的查询量,也就是说可以节省很多算力资源。
字节发布AnimateDiff-Lightning模型 4步推理就能生成高质量视频
字节发布了一款名为AnimateDiff-Lightning的模型,这款模型在视频生成方面的性能表现令人瞩目。只需4-8步的推理,就能生成质量非常不错的视频,这对于视频制作行业来说无疑是一次重大的技术突破。字节发布的AnimateDiff-Lightning模型,以其强大的视频生成能力,为视频制作行业带来了新的可能,同时也为视频制作者提供更多的选择和便利。
李彦宏:百度文心大模型推理成本已降至1%!与三星、荣耀等达成合作
在百度2023年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。李彦宏表示,自发布以来,百度不断降低文心大模型的推理成本,文心一言”3.5版本的推理成本是3.0版本的1%。我们也希望以此为契机打造以文心一言”为核心的生态系统,同时也希望越来越多的用户能够从中获益”,李彦宏表示。
OpenDiT:一个用来加速类似Sora的DiT架构模型训练和推理项目
OpenDiT是一个针对DiT训练和推断的高性能系统,它通过Colossal-AI提供支持,并以提高效率为目标。该系统通过优化内核、采用混合并行方法以及引入FastSeq等技术,能够显著提高GPU计算速度并降低内存占用,为DiT应用带来了巨大的性能提升。OpenDiT的出现为DiT应用的训练和推断提供了便利,其高效的实现方式和简单易用的接口使得用户可以更加专注于应用场景和算法的研究无需过多
逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时,前提信息的呈现顺序对其表现具有决定性影响。在逻辑推理和数学问题中,前提按照逻辑自然顺序排列时,模型表现更佳。在逻辑推理中,前提顺序对大型语言模型推理表现有重大影响,如何应对这一问题仍是一个挑战。
DeepMind研究发现提升语言模型推理能力的简单方法
深度学习领域的研究人员发现,语言模型在逻辑推理方面的表现仍然是一个重要挑战。最新的一项由Google旗下的DeepMind进行的研究揭示了一个简单重要的发现:任务中前提的顺序显著影响语言模型的逻辑推理性能。通过这项研究,我们可以看到改变前提顺序可能是提升语言模型推理能力的一种简单有效的方法,也为未来改进这一领域的研究提供了新的方向。
AI视野:英伟达推文生图模型ConsiStory;高度可控AI试衣OOTDiffusion;开发者推SoraWebui开源项目;Groq最快AI推理芯片成本推算高得离谱
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元
Groq公司推出了一款号称性价比高达英伟达GPU100倍的AI推理芯片,引起了广泛关注。运行其最快AI推理芯片LIama2所需的成本高达1171万美元,让业内人士开始对其效益进行热议。Groq推出的AI推理芯片在性能上取得了突破,但成本问题仍需解决。
AI视野:大模型最快推理芯片Groq登场;真人视频冒充Sora;Stable Diffusion WebUI Forge推出;字节辟谣推出中文版Sora
大模型最快推理芯片一夜易主 Groq每秒可达500 tokens
一家名为Groq的初创公司推出了一款大模型推理芯片,其推理速度达到了每秒500tokens的惊人水平,轻松颠覆了传统GPU的性能。Groq的团队由谷歌TPU原班人马组成,他们自主研发的芯片不仅速度快成本低廉,性价比高,成为了大模型推理加速的新宠。在技术不断创新和竞争日益激烈的背景下,Groq将继续致力于推动大模型硬件领域的发展,为人工智能技术的进步做出更大的贡献。