Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要任何系统代码,完全通过分析图像来理解和操作手机。它能够自动完成各种任务,比如可以在淘宝加购物车车,在APP播放音乐,自主使用导航APP,收发邮件等等。
Mobile-Agent官网体验入口 自主多模移动设备AI在线使用地址
Mobile-Agent是一款自主多模移动设备代理,采用先进的多模大语言模型技术。该代理利用视觉感知工具准确识别和定位应用程序前端界面的视觉和文字元素,实现了自主规划和分解复杂操作任务,通过逐步操作导航移动应用程序。点击上方链接,探索Mobile-Agent为自动化移动设备操作、评估移动设备性能和提高应用程序适应性带来的前所未有的便利。
Mobile ALOHA:一种低成本的整体远程操作系统用于数据收集
研究人员从斯坦福大学对使用模仿学习进行整体远程操作的任务进行了研究。这种方法在许多日常情况下需要整体远程操作的协调,包括移动和灵巧操作不仅仅是单个的移动或操作行为。每项任务只需50个人类示例,协同训练就可以让我们获得超过80%的性能,与没有协同训练相比,平均绝对提高34%。
微软Win10 Mobile应用商店悄然关闭:一代经典彻底落幕
近日有网友发现,微软Win10Mobile平台MicrosoftStore应用商店所有核心功能都被悄然关闭。商店首页完全无法加载,应用下载和更新页面无法加载,应用详情页面也是时断时续。但无论如何,微软都是选择放弃了Windows10Mobile和WindowsPhone8操作系统。