Jasper公司收购Stability AI旗下的AI图像平台Clipdrop
AI企业软件公司Jasper成功完成对StabilityAI旗下ClipdropAI图像平台的收购。该平台以其强大的图像编辑工具闻名,用户可通过JasperAPI获得企业服务消费者仍可在Clipdrop.co购买独立版本。这次收购将进一步推动Jasper公司在AI图像处理领域的市场份额,同时StabilityAI则通过出售Clipdrop来缓解其财务压力,为其未来发展寻找更稳固的方向。
谷歌推出ASPIRE框架 让大模型具备自我判断意识
谷歌最近推出了一项名为ASPIRE的自适应评估框架,旨在帮助大型语言模型在面对置信度较低的样本时做出正确的判断。这个框架的核心技术思路是基于自我评估的选择性预测,通过任务定向微调、答案采样和自我评估学习三大模块来实现。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。
谷歌推出ASPIRE框架 用于增强大模型的选择性预测能力
在人工智能领域中,大型语言模型的重要性不言喻。传统的LLMs在预测过程中存在困难,无法对生成的答案的准确性进行自我评估。引入ASPIRE框架填补了这一空白,通过对LLMs进行微调和自我评估训练,提高了LLMs的选择性预测能力,为LLMs的应用提供了更高的可靠性和可信度。
新增全时四驱、专属服务:蔚来推送Aspen 3.5.0版本更新
全新版本的Aspen白杨3.5.0CN系统将于2024年1月19日正式开启分批推送。此次更新主要包含5智能驾驶、智能座舱、车身动力等5大方面。NOMI方面,新增记事功能和逗玩表情,用户可以通过语音创建需要提醒的信息,该功能还可以和日历进行联动。
硅谷AI圈爆火热文:AIGC热潮退后,最大输家或为Jasper和VC
近期硅谷AI创业市场发生了翻天覆地的变化,曾一度低迷的AI创业生态在一波投资热潮中迎来了复兴。这场狂潮带来的并非是所有公司的成功是明显的赢家和输家。AI创业者需要审时度势,避免被热钱冲昏头脑,同时在产品定位、技术壁垒和市场需求等方面精益求精,方能在竞争激烈的市场中脱颖出。
GitHub发布编程字体家族Monaspace 支持混合使用5款等宽字体
代码托管平台GitHub发布了一套名为Monaspace的开源编程字体家族。这套字体家族包含5种字体,分别是Neon、Argon、Krypton、Xenon和Radon。希望通过这款字体家族为编程工作带来更多乐趣。
小米:已捐献“UltraSpace 存储扩容” 相信友商会跟进
小米14正式发布,除了常规硬件升级外,雷军还宣布了一项重磅功能,即澎湃OS配合存储实现的存储扩容。小米将原本256GB的存储容量提升到了264GB原本512GB的存储容量更是提升到了528GB。小米已经将这个技术标准贡献给了UFS协会组织,这意味着不久的将来,各大手机厂商应该都会适配这个功能。
小姐姐一口气给出10多个指令:小米SU7车机从容应对 最后还反问一句
小米SU7除了颜值高、性能强悍之外,车机系统对比其它品牌,也是遥遥领先的存在。一位小姐姐车主实测了小米SU7的车机智能水平,她在喊了一声小爱同学后,接着就一口气给出了10多个语音操控指令。小米SU7的车机为16.1英寸3K中控屏,搭载骁龙8295座舱芯片,承载小米HyperOS澎湃车机系统,车机整体的细节、流畅度、互联体验,被不少车友称赞为目前天花板级别。
Midreal AI互动小说游戏网页版本更新 更遵循指令,逻辑也更强
MidrealAI互动小说游戏进行了一次重要的更新,推出了全新的网页版本。这一版本的发布使得用户不再需要在Discord平台上进行操作,大大提高了用户的使用便利性。在我尝试的过程中发现,之前中文的小说常常会有逻辑问题,但在这次的更新之后,这个问题得到了很大的改善。
开源AI框架LaVague:理解自然语言指令 实现浏览器交互自动化
LaVague是一个旨在自动化浏览器交互的大型动作模型框架,通过将自然语言指令转化为无缝的浏览器交互,重新定义了互联网浏览体验。该框架的设计初衷是为用户自动化繁琐的任务,节省时间,让用户能够专注于更有意义的事务。未来的发展方向可能包括优化本地模型、改进信息检索以确保生成的代码片段相关性、支持其他浏览器引擎等。
Midjourney角色一致性功能使用方法教程 MJ6指令提示词Cref详细用法教程介绍
Midjourney推出了一种新工具——角色一致性功能,帮助用户复制他们喜欢的风格。这是MidjourneyV6的新功能。将推出官方的V6beta版。
普渡大学发布Talk2Drive框架 为自动驾驶汽车提供智能指令解析能力
普渡大学最新发布了Talk2Drive框架,利用大型语言模型为自动驾驶汽车提供智能指令解析能力。这一框架的核心在于通过接收命令、处理与推理,生成可执行代码,结合云端实时环境数据来实现人车交互的全新方式。Talk2Drive框架的推出将为自动驾驶汽车提供更加安全、舒适和个性化的驾驶体验,预示着以人为本、智能化的未来交通时代的到来。
Gemma-2B-IT官网体验入口 谷歌AI开源模型指令调整工具使用方法
Gemma-2B-IT是谷歌推出的2B参数指令调整模型,基于Gemini架构,专为提高数学、推理和代码处理能力设计。该模型在普通笔记本上即可运行,无需庞大的AI算力,适用于多种应用场景。赶快体验这款强大的AI写作指令调整工具吧!
这还怎么升!微软又提高Win11升级门槛:CPU需支持POPCNT指令
微软让升级Windows11的硬件条件越来越苛刻了,所以你升级还是不升级呢?微软正在把带有POPCNT指令的CPU作为Windows1124H2的一项要求。不过在Steam调查的参与者中,新操作系统的表现要好一些,几乎一半的被访者都在使用Windows11。
苹果开源图像新技术ml-mgie 可通过指令修改图片
苹果开源了一种新的技术,名为多模态大语言模型引导的编辑,这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。MGIE采用多模态大型语言模型进行图像编辑指令的生成,通过端到端训练,模型不仅捕捉视觉想象力执行图像处理操作。在实现更加直观和自由的图像编辑过程中,这一方法有望为未来的计算机视觉和图像处理研究提供新的思路。
InstructIR:可按照人类指令进行高质量图像修复
图像恢复是一个基本问题,涉及从模糊的照片中恢复高质量的干净图像。多合一图像恢复模型可以使用特定于退化的信息作为指导恢复模型的提示,有效地从各种类型和级别的退化中恢复图像。你还可以尝试常规图像增强提示,看看它如何改善颜色。
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令
用图2的风格画图1的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比PS大神抓着你的手助你P图。请参阅原始论文以获取更多详细信息。
多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动
MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。MotionGPT不仅是一种技术的突破,更是对人机交互的重大推动,将语言与运动巧妙地融合,开创了全新的应用前景。
东京大学开发仿人机器人Alter3 能执行ChatGPT指令
Alter3是由日本东京大学开发的一种仿人机器人。研究人员通过将Alter3与GPT-4相连接,成功实现了让机器人模仿人类行为的目标。他们认为这项研究为探索人工智能与仿人机器人的交互提供了新的途径,也为机器人在日常生活中的运用带来了更多可能性。
网易有道词典发布2023年度词汇 AI大模型指令“Prompt”
刚刚过去的一年,网易有道词典公布了2023年度词汇:Prompt。Prompt的查词量在有道词典中增长了惊人的1872%。随着科技的发展,每个人都具备造Prompt能力,将人类的思考和需求注入给AI。