研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物
在当今智能手机技术不断发展的世界中,对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求,该代理结合了图像处理和文本推理,使其能够在iPhone上执行购物任务。如果进一步发展,我能看到这项技术有各种用途-自动化QA测试,帮助残障人士,甚至在我们忙于其他工作时为我们完成手机上的任务。