谷歌发布可读屏AI模型ScreenAI:可理解用户界面和信息图表
谷歌研究最新发布的ScreenAI标志着语言和语音控制计算机界面的又一重要进展。这一AI模型不仅能理解用户界面和信息图表在回答基于信息图表的问题、总结内容以及导航用户界面等多项任务上,创下了新的性能标杆。为鼓励更多的发展,谷歌研究计划发布ScreenAI的评估数据集,其中ScreenQA已经提供了包含36,000张截图的86,000个问答对;更复杂的变体和包含截图及其文本描述的集合将会推出。
要站在“社会变革”的立场上理解AI
看到一个表述——看待AI的发展,不能只站在技术变革和商业创新的层面来理解它。应该更多站在“社会变革”的层面来理解它。能理解到这一层,你要去思考应对AI带来的各种挑战,也许才会更坦然。