AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
智谱 AI 开源视觉语言模型 CogAgent 支持GUI图形界面问答
智谱AI开源了CogAgent,它是一个视觉语言模型,拥有180亿参数规模。该模型在GUI理解和导航方面表现出色,在多个基准测试上取得了SOTA的通用性能。CogAgent还支持OCR相关任务,通过预训练和微调,其能力得到了显著提升。
AI视野:Stability.ai开源SDXL Turbo;Pika Labs1.0版发布;字节跳动ChitChop在海外上线;Keras3.0正式发布;法院判决AI生成图片具备版权
文生成图AI平台Stability.ai发布开源SDXLTurbo,图像生成实时响应,仅需1秒。SDXLTurbo基于全新对抗扩散蒸馏技术,将生成步骤减至1-4步,保持高质量。测试结果显示对相对清晰的视频效果显著,为提升视频素材清晰度带来新可能。
AI视野:OpenAI成全球第三最有价值初创公司;SDXL推精简版本;小米14将搭载WPS AI功能;Bing AI拒绝生成女性逼真图像
微软的Bing AI图片生成器在生成逼真男性图像方面表现出色,但拒绝生成逼真女性图像,声称这不符合其内容政策,引发了性别相关问题的讨论。
曝iPhone 16 Pro性能怪兽来了 AI GPU图形方面的升级可能相对有限
苹果计划在iPhone16Pro机型中使用更大尺寸的A18Pro芯片,以提升其人工智能性能。该芯片将配备6核图形处理器,与iPhone15Pro机型的A17Pro芯片相当。值得一提的是,苹果公司预计将于今年九月份发布iPhone16系列智能手机。
研究表明:GPT-4在图形推理任务上表现不佳,准确率仅33%
最近的研究表明,GPT-4在图形推理任务上表现不佳,仅有33%的准确率,引发了对大型语言模型图形处理能力的关注。通过使用ConceptARC数据集,研究者对451名人类受试者进行了图形推理任务测试,结果显示人类在这方面表现卓越,平均准确率达到91%。这项研究突显了目前大型语言模型在某些特定任务上的局限性,并提出了对研究方法的进一步审视的需求。