Meta开发AudioSeal技术,可以秘密为 Deepfake 音频添加水印
Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。随着威胁形势的变化,更好的解决方案仍需要不断发展,以识别操纵风险并在人工智能能力不断增强的背景下建立对语音界面的信任。
索尼本田移动与微软合作开发 Afeela 汽车人工智能
索尼正在与本田合作推出名为Afeela的电动汽车,计划于2025年首次亮相。索尼在发布会上宣布,正在与微软合作开发人工智能和其他技术,以应对汽车行业的变革,为Afeela汽车的推出做好准备。索尼还在西门子的主题演讲中展示了这一产品。
AI生成前端代码项目“Coffee” 开发速度提高10倍
Coffee是一款旨在通过人工智能提高前端开发效率的工具。它可以生成干净、可维护的前端组件代码。支持其他框架:Coffee计划扩展对其他流行前端框架的支持,以增加其适用范围。
小鹏汽车与大众汽车集团签订EEA电子电气架构技术战略合作框架协议
小鹏汽车与大众汽车集团签订了EEA电子电气架构技术战略合作框架协议,双方将联合开发行业领先的电子电气架构。这一框架协议将使小鹏汽车最新一代基于中央计算和域控制器的电子电气架构集成到大众汽车在中国生产的电动车型上,预计从2026年开始应用。这一合作框架协议标志着小鹏汽车与大众汽车集团在中国市场电动车平台领域的战略合作,开启了双方合作的新里程碑。
「有效上下文」提升20倍!DeepMind发布ReadAgent框架
【新智元导读】模仿人类阅读过程,先分段摘要再回忆,谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能,有效上下文提升了3-20倍。基于Transformer的大语言模型具有很强的语言理解能力,但LLM一次能够读取的文本量仍然受到极大限制。还可以看到ReadAgentS大大优于ReadAgent-P,性能改进的代价是检索阶段的请求数量增加了六倍。
Embedchain官网体验入口 AI应用开发框架软件免费下载地址
Embedchain是一个开源的RAG框架,旨在简化AI应用的创建和部署。它的设计原则是“常规但可配置”,适用于软件工程师和机器学习工程师。要获取更多详细信息并开始您的AI应用开发之旅,请访问Embedchain官方网站。
谷歌DeepMind提出AGI能力与行为分类框架
在最新的研究中,来自谷歌DeepMind的研究团队提出了一个名为“LevelsofAGI”的框架,旨在系统地分类人工通用智能模型及其前身,类似于自动驾驶的级别。这个框架引入了三个重要的维度:自主性、普适性和性能,为比较模型、评估风险以及追踪人工智能进展提供了一个共同的词汇。该框架强调了将其负责和安全地整合到以人为中心的环境中的需求,并提供了一种结构化的方式来评估、比较和指导AGI系统的发展和部署。
斯坦福开发机器人学习框架UMI 可直接复制人类操作给机器人
UMI是斯坦福开发的一个机器人数据收集和策略学习框架,通过手持式夹持器和精心设计的接口进行数据收集。该框架能够将人类在复杂环境下的操作技能直接转移给机器人,无需人类编写详细的编程指令。通过UMI,机器人能够快速学习新任务,提高操作能力,降低学习成本,推动机器人技术在各领域的广泛应用。
研究团队开发开源大模型训练框架 Oobleck 提供快速且有保障的故障修复
随着对生成式人工智能技术需求的激增,大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战,密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。Oobleck的开发标志着利用固有冗余提高容错性的新里程碑,为大型模型的高效训练和故障恢复提供了一种创新性的解决方案。
清华阿里等共同开发基于扩散模型的框架DreamTalk 可以让人物头像说话
DreamTalk是一个由清华大学、阿里巴巴和华中科大共同开发的基于扩散模型的框架,可以让人物头像说话、唱歌并保持嘴唇的同步和模仿表情变化。项目地址:https://dreamtalk-project.github.io/这一框架具有以下特点:DreamTalk能够生成高质量的动画,使人物脸部动作看起来非常真实。DreamTalk是一个具有创新技术的框架,能够为人物头像赋予说话和表情的能力,为多种领域带来更加生动和丰