阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机
MobileAgent是由阿里巴巴开发的一个自主多模态AI代理,可以模拟人类操作手机,是一个纯视觉解决方案,不需要任何系统代码,完全通过分析图像来理解和操作手机。项目地址:https://top.aibase.com/tool/mobile-agent特点:依赖于纯视觉解决方案:MobileAgent通过分析图像来理解和操作手机无需任何系统代码。观察、思考和行动是MobileAgent采用的提示格式,要求代理输出三个组成部分。
Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要任何系统代码,完全通过分析图像来理解和操作手机。它能够自动完成各种任务,比如可以在淘宝加购物车车,在APP播放音乐,自主使用导航APP,收发邮件等等。
人类首次植入脑机接口芯片!马斯克:用意念就能控制手机、电脑
今早的科技圈被马斯克旗下脑机接口公司Neuralink刷屏。马斯克宣布昨天,人类首次接受脑机接口芯片植入,植入者恢复良好。此消息一出,很多美国网友纷纷自告奋勇,愿意充当小白鼠”参与实验。
上热搜了!人类历史上第一条手机短信来自诺基亚
微博话题人类历史上第一条手机短信”上了热搜榜。人类历史上第一条手机短信来自诺基亚,时间是1992年12月,短信内容只有简简单单的一句话:MerryChristmas。当时的诺基亚仍然坚信自己的塞班系统能够抵挡住任何竞争对手的冲击,但事实证明,塞班系统以及后来的WindowsPhone系统都没有成功,昔日手机巨头最终走向没落。
AI已经会“玩”手机了!腾讯开发AppAgent 可模仿人类在手机上操作APP
腾讯和德州大学达拉斯分校的研究团队合作开发了一个名为AppAgent的项目,该项目可以通过自主学习和模仿人类的点击和滑动手势,在手机上执行各种任务。这包括在社交媒体上发帖、帮助用户撰写和发送邮件、使用地图、在线购物,甚至进行复杂的图像编辑。这一创新的技术为用户提供了更便捷和高效的手机应用程序操作体验。
联发科新芯片天玑 8300 将 ChatGPT 类似的人工智能技术带到更实惠的手机上
芯片制造商联发科最近推出了旗舰级的天玑9300移动芯片,将在高端安卓手机中实现本地生成式人工智能功能。该公司正式发布了新芯片天玑8300,将为更实惠的手机提供同样的功能。小米已经确认红米K70E将于本月晚些时候推出天玑8300。
京东小时达免运费门槛降至29元:覆盖全品类商品
今天京东官方正式宣布,京东小时达再次降低免运门槛,购物满29元可免运费。凡带有满¥29免运费”标签的商家,均可实现下单满29元即免运费,最快30分钟送货上门。最重要的是还不限次数,用户不用再拼单、凑单,即买即享不用囤,非常方便。
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东
能不能有一种通用的图模型——它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?或者既能预测不同作者的论文引用可以发现基因网络中的人类衰老机制?你还真别说,被ICLR2024接收为Spotlight的“OneforAll”框架就实现了这个“精髓”。它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。更多研究细节,可参考原�
Midjourney网站Alpha版本优化 增加3个分类
Midjoureny网站的Alpha版本进行了一系列体验优化,主要是对探索页面进行了改进。这次更新主要包括对鼠标悬停效果的丰富化,对页面内容的进一步优化,以及新增了热门、精选和随机浏览选项。希望这些优化能够为用户带来更好的使用体验。
Cohere全面推出微调套件:聊天、重新排序、多标签分类一应俱全
Cohere宣布推出全新的全面微调套件,其中包括聊天微调、重新排序微调和多标签分类微调等三项新功能,以及现有的生成微调解决方案,旨在满足企业在微调各种AI应用时的需求。通过这些新功能,企业可以定制Cohere的生成和表示模型,以在文本生成、摘要、聊天、分类和企业搜索等目标用例上提供更好的性能。开发人员可以按照指南学习有关它们如何工作的更多信息。
Google DeepMind 提出人工通用智能(AGI)的新定义及其分类
近日,GoogleDeepMind的研究团队发布了一篇研究论文,对人工通用智能的定义进行了重新阐释,并提出了一个全新的AGI分类体系。这一定义不仅切中了技术界对AGI概念的混淆和争议为该领域提供了更清晰的理解框架。随着人工智能技术的不断进步和广泛应用,这项工作可能对整个行业产生深远的影响。
Google Photos推出AI功能,智能整理照片,分类更便捷
GooglePhotos日前推出了一系列新功能,利用人工智能技术更好地为您组织和分类照片。其中一个新功能称为“PhotoStacks”,Google将利用AI识别一组同时拍摄的照片中的“最佳”照片,并将其选为该组的顶部选择,以减少您的照片库中的混乱。这反映了人工智能技术在不同领域的广泛应用和创新。
谷歌DeepMind提出AGI能力与行为分类框架
在最新的研究中,来自谷歌DeepMind的研究团队提出了一个名为“LevelsofAGI”的框架,旨在系统地分类人工通用智能模型及其前身,类似于自动驾驶的级别。这个框架引入了三个重要的维度:自主性、普适性和性能,为比较模型、评估风险以及追踪人工智能进展提供了一个共同的词汇。该框架强调了将其负责和安全地整合到以人为中心的环境中的需求,并提供了一种结构化的方式来评估、比较和指导AGI系统的发展和部署。