谷歌发布可读屏AI模型ScreenAI:可理解用户界面和信息图表
谷歌研究最新发布的ScreenAI标志着语言和语音控制计算机界面的又一重要进展。这一AI模型不仅能理解用户界面和信息图表在回答基于信息图表的问题、总结内容以及导航用户界面等多项任务上,创下了新的性能标杆。为鼓励更多的发展,谷歌研究计划发布ScreenAI的评估数据集,其中ScreenQA已经提供了包含36,000张截图的86,000个问答对;更复杂的变体和包含截图及其文本描述的集合将会推出。
谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型
划重点:⭐️GoogleAI团队提出了ScreenAI,这是一个视觉语言模型,可以全面理解UI和信息图。⭐️ScreenAI在多个任务上表现出色,包括图形问答,元素注释,摘要生成等。通过利用这些组件的共同视觉语言和复杂设计,ScreenAI为理解数字内容提供了全面的方法。
OneChart:仅2亿参数,专门用于图表信息结构化提取
在图表解析领域,由于样式、数值、文本等的多样性,存在着重大挑战。即使是拥有数十亿参数的先进大型视觉-语言模型也难以令人满意地处理此类任务。研究团队提出的OneChart在图表结构提取方面取得了令人瞩目的成绩,为解决图表解析中的挑战提供了新的思路和方法。
马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息
在人工智能领域,多模态模型的发展一直是行业关注的焦点。马斯克XAI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公司在人工智能技术上迈出了重要一步。随着该模型的进一步优化和应用,我们有理由相信,它将在多个领域发挥重要作用,推动人工智能技术向前发展。
谷歌Chrome搜索建议升级:个性化、图像化搜索助您快速发现信息
谷歌今日宣布对Chrome浏览器中的搜索建议进行了重大改进,旨在为用户带来更加智能、个性化、丰富的搜索体验。作为这一变化的一部分,用户将能够从其他人的搜索内容中获取更有用的建议,查看更多的搜索建议图像,并在连接较差的情况下继续获得搜索建议。这一更新意味着用户即使在隐身模式下浏览时,仍将获得更多有用的建议。
跑长途高速不怕充电难!百度地图宣布接入全国服务区充电站信息
相信很多新能源车车主跑长途高速时都会担心充电困难,比如下一个服务区有没有充电桩,或者服务区充电桩是否排队。百度地图宣布联合交通运输部公路局,将全国高速公路沿线的充电基础设施信息上线到百度地图,极大地提升了百度地图服务区充电站信息的覆盖率、准确度和时效性。北京、辽宁、吉林、上海、浙江等11个省高速公路服务区充电设施覆盖率达到100%。
卢伟冰打造的旗舰焊门员!一图了解Redmi K70E所有关键信息
据Redmi官微消息,RedmiK70E会在本月登场,该机的散热、性能、屏幕、电池等关键信息已经公布。RedmiK70E采用第二代1.5K旗舰直屏,峰值亮度达到了1800尼特,支持1920Hz高频PWM调光。K70E的性能表现在接下来很长一段时间都不会有对手,是新一代旗舰焊门员,做到了彻彻底底的同档无敌。
StableDesign:适用于室内装修设计的SD方案 文字提示就可修改室内设计图
有开发者开发了StableDesign项目,旨在为生成式室内设计提供数据集和训练方法。这是一个适用于室内装修设计的SD方案,上传一张空房间的图片,输入文字提示,可以按要求生成装修效果图。StableDesign生成的效果可不能全信,比如有时会把承重墙改没了。
蚂蚁集团CodeFuse 发布“图生代码”功能,支持产品设计图一键生成代码
4月11日,蚂蚁集团自研的智能研发平台CodeFuse推出“图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率。目前相关功能正在内测。“AI目前主要集中在辅助编程,要从copilot走向co-worker,实现整个研发生命周期的智能化、自动化有很长的路要走。
车长超5米 定位中大型!星途首款MPV设计图曝光
快科技4月8日消息,据媒体报道,日前星途首款MPV的设计图在网上曝光。从设计图中可以看出,新车的外观再次采用了颠覆性的设计,与传统的MPV造型形成了明显对比。前脸部分,新车的车头与车顶呈现出连贯的弧线,犹如一艘飞船般的设计,别具一格。此外,车头采用了负角度的设计风格,营造出激进的俯冲感,而下包围的前凸设计则进一步提升了车头的层次感。在侧面视角,车身线条平直流畅,前后翼子板似乎向外突出,增加了车辆的横向视觉效果,同时也为车内乘坐空间带来了更大的舒适感。车尾部分,新车采用了类似X形的大灯设计,提升了尾部的辨?
高端设计下放!OPPO A3 Pro渲染图首曝:采用Find N3同款Deco
近日,有外媒放出了OPPOA3Pro的渲染图,相机deco与上代的A2Pro有着非常明显的变化。OPPOA3Pro的背面相机模块在维持了上代A2Pro的大院换的基础上,布局发生了变化,两枚摄像头与闪光灯呈倒三角排列,上方有一枚装饰物,四枚圆圈组成了类似OPPOFindN3的Deco设计。OPPOA3Pro有望在本月正式发布,敬请期待。
Canva 收购创意软件巨头 Affinity,扩大专业设计市场版图
全球领先的视觉传播平台Canva今日宣布收购创意软件套件Affinity。这一举动将大大增强Canva打造最全面视觉通信工具的愿景。Affinity的加入将为设计师在创作过程的各个阶段提供更强大的工具支持,助力Canva实现成为世界上最全面视觉通信平台的目标。
专为Stable Diffusion 1.5设计!IP Composition Adapter模型可模仿图片构图
一款名为IPCompositionAdapter的新型适配器引起了广泛关注。该适配器专为StableDiffusion1.5模型设计,其独特之处在于能够在新生成的图像中同步构图忽略风格和内容。随着SDXL变种的研发进展,我们有理由相信,这款适配器将为用户带来更加丰富的创意体验。
Unicorn Studio:一款基于WebGL的设计工具 一键给图片或视频加炫酷效果
UnicornStudio是一款基于WebGL的设计工具,旨在帮助用户打造引人入胜的网页体验和视觉资产。用户可以利用WebGL给图片或者视频加上各种炫酷的效果。SDK还允许用户在网站上运行代码,以实现最大的性能表现。
Muse Pro:一款专为iPad设计的AI实时画图应用
在数字艺术创作的世界里,一款新的应用程序MusePro正在引领一场创新革命。这款为iPad专门设计的AI实时画图应用,不仅将AI实时画图商业化,更是极大地提升了创作的直观性和互动性。无论你是艺术家是艺术爱好者,都值得一试。
iPhone 16 Pro手机设计图曝光 亮点抢先看
3月9日,一组iPhone16Pro的渲染图在网上曝光。这款手机的设计已经出现了多个版本,真真假假让人难以分辨。至于这款手机是否值得购买,那就要等到发布会上才能揭晓了。
苹果iPhone 16 Pro最新外观设计图曝光
根据最新CAD渲染图,iPhone16Pro将采用更窄的边框和更小的R角,以提高屏占比。电源按钮下方新增了一个电容式触摸拍照按钮,并略微放大操作按钮尺寸。电池容量略大于3355mAh。
Design2Code:提供设计图,让多模态LLM自动生成前端代码
生成AI在多模态理解和代码生成方面取得了显著进展,为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务的系统研究。详细的细分指标表明,开源模型在从输入网页中召回视觉元素和生成正确布局设计方面大多落后在文本内容和着色方面则可以通过适当的微调得到显著改进。
三大调整抢先看!iPhone 16设计渲染图曝光:苹果欲放弃静音拨片
据国外媒体报道称,苹果正在对iPhone16的外形设计做调整从曝光的外形渲染图来看,调整还是比较明显。从曝光的CAD图来看,苹果可能重新设计iPhone16机身背面,采用垂直摄像头配置。现在的问题是,你对于这些所谓的外形设计调整,真的买单吗,毕竟iPhone在中国市场已经受到了华为等国产机的强烈冲击。
AI视野:ElevenLabs将为Sora上线AI音效功能;文生图模型Stable Cascade上线;苹果推出AI动画设计工具Keyframer;AI生成的西游记短片震惊网友
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。