谷歌发布可读屏AI模型ScreenAI:可理解用户界面和信息图表
谷歌研究最新发布的ScreenAI标志着语言和语音控制计算机界面的又一重要进展。这一AI模型不仅能理解用户界面和信息图表在回答基于信息图表的问题、总结内容以及导航用户界面等多项任务上,创下了新的性能标杆。为鼓励更多的发展,谷歌研究计划发布ScreenAI的评估数据集,其中ScreenQA已经提供了包含36,000张截图的86,000个问答对;更复杂的变体和包含截图及其文本描述的集合将会推出。
谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型
划重点:⭐️GoogleAI团队提出了ScreenAI,这是一个视觉语言模型,可以全面理解UI和信息图。⭐️ScreenAI在多个任务上表现出色,包括图形问答,元素注释,摘要生成等。通过利用这些组件的共同视觉语言和复杂设计,ScreenAI为理解数字内容提供了全面的方法。
Salesforce 首席执行官强调 AI 安全和信任原则:我们不想看到人工智能「广岛时刻」
在瑞士达沃斯世界经济论坛的一次小组讨论中,SalesforceCEOMarcBenioff表示,为避免出现「AI广岛时刻」,科技行业正在制定安全协议并确立信任原则,应对当前风靡全球的AI软件发展。MarcBenioff在当地时间周四的论坛上指出:「这是AI的一个重大时刻。这是一个放大人类所做的工作的工具,让人们更好地完成工作,让AI完成工作的一部分。