零一万物API开放 多模态中文图表体验超越GPT-4V
零一万物API正式向开发者开放,其中包含三款强大的模型。首先是Yi-34B-Chat-0205,支持通用聊天、问答、对话、写作和翻译等功能;其次是Yi-34B-Chat-200K,能处理多文档阅读理解和构建超长知识库;最后是Yi-VL-Plus多模态模型,支持文本、视觉多模态输入,中文图表体验超越GPT-4V。无论是在图表识别、文本理解还是长篇文本分析方面,这些模型都展现出了令人惊叹的性能。
多视角高斯模型LGM:5秒产出高质量3D物体 支持图文到3D
由北京大学、南洋理工大学S-Lab和上海人工智能实验室联合研究的团队推出的大型多视角高斯模型引起广泛关注。LGM以其核心模块LargeMulti-ViewGaussianModel为基础,采用了一种新颖的方法,能够在仅5秒的时间内从单一视角图片或文本输入中生成高分辨率高质量的3D物体。LGM通过创新的3D表示和骨干结构,以及高效的训练方法,实现了在高分辨率3D内容生成方面的显著进展。
图片、视频直接生成3D高斯分布!免费体验,已正式商用
图源备注:图片由AI生成,图片授权服务商Midjourney知名3D扫描应用企业Polycam在官网宣布,结束对3DGAUSSIANSPLATS的测试,正式投入商业使用。3DGS是一款通过图片或视频,就能直接生成3D高斯分布的生成式AI产品。3DGS的渲染速度非常快,如果图片质量、视频比较小,完全能够做到实时交互。