吉娃娃or松饼难题被解决!IDEA研究院新模型T-Rex2打通文本视觉Prompt,连黑客帝国的子弹都能数清楚
还记得黑客帝国经典的子弹时间吗?IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~面对难倒一众大模型「吉娃娃or松饼」的难题,它只需被投喂一张吉娃娃的照片,就能瞬间迎刃解。也是同样的团队,推出了基于视觉提示的检测模型T-Rex。T-Rex2让通用物体检测又迈出了新的一步。
南方科技大学联合IDEA研究院发布 SUS-Chat-34B 双语模型
南方科技大学联合IDEA研究院CCNL中心发布了SUS-Chat-34B,这是一个参数规模为340亿的双语模型。该模型在众多中英文任务上表现出色,超越了其他同参数规模的模型。即使与更大参数规模的模型相比,SUS-Chat-34B模型也具有不错的竞争力更长的上下文窗口与出色的多轮对话能力:SUS-Chat-34B原生支持8K的上下文窗口,在大量多轮指令以及单多轮混合数据中进行训练,具有出色的长文本对话信息关注与指令跟随能力。
Transformer变革3D建模,MeshGPT生成效果惊动专业建模师,网友:革命性idea
在计算机图形学中,「三角形网格」是3D几何物体的主要表现形式,也是游戏、电影和VR界面中主要使用的3D资产表示方法。业界通常基于三角形网格来模拟复杂物体的表面,如建筑、车辆、动物,常见的几何变换、几何检测、渲染着色等动作,也需要基于三角形网格进行。如下图9所示,MeshGPT还可以基于给定的局部形状推断出多种可能的补全,生成多种形状假设。
IDEA提出ToG思维图谱 大模型性能提升214%!
由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型与知识图谱,成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。这一研究成果为深度推理领域的发展带来了新的思路和方法,为实现大模型在各领域应用中更可靠、可解释的推理能力提供了有力支持。
用视觉来做Prompt!沈向洋展示IDEA研究院新模型,无需训练或微调,开箱即用
用视觉来做Prompt,是种什么体验?只需在图里随便框一下,结果秒秒钟圈出同一类别!即便是那种GPT-4V都难搞定的数米粒的环节。只需要你手动拉一下框,就能找出所有米粒来。发布会最后,沈向洋发布《低空经济发展白皮书——深圳方案》,在其智能融合低空系统中,提出时空进程新概念。
Midjourney v6版本describe功能上线 生成的提示词更长更详细
Midjourneyv6版本的/describe已经上线,上传图片后会生成更长更详细的提示词,同时更符合V6模型的倾向。这意味着用户现在可以更加轻松地获取关于上传的图片的详细信息。通过使用/describe功能,用户可以上传一张图片,然后系统将生成更长更详细的提示词,让用户更好地了解图片的内容和特点。
Midjourney计划推出中国版Midjourney Desktop App
MidjourneyOfficeHour本周宣布,他们正在与中国的员工合作,计划推出一个类似于Slack的中国版MidjourneyDesktopApp。这个新版本的应用在总体设计上与官方版一致,但在组织内容的方式、社交功能以及针对当地监管机构的管理功能上存在差异。Midjourney正在开发一个名为“样式探索器”的功能,它类似于一个随机样式生成器,帮助用户探索和尝试不同的创作风格,增加创作的多样性和趣味性。
每日AI:谷歌推AI视频VideoPrism;ChatGPT新增文本朗读功能;Stability AI推图片放大工具Creative Upscaler;Stable Diffusion安卓版客户端来了
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
StableVideo文生视频官网入口 一键AI视频生成软件网页版免费使用地址
StableVideo是一个基于AI的视频生成平台,用户可以通过文本或图像将概念转化为引人入胜的视频。以下是该平台的详细介绍:StableVideo工作原理基于AI技术:采用最先进的深度学习技术,高质量生成各类视频内容。想要体验「StableVideo」的强大功能,请访问AIbase网站查看更多介绍。
蚂蚁百灵研发助手CodeFuse插件发布新版 新增支持 Android Studio
蚂蚁百灵研发助手CodeFuse插件发布新版,新增支持AndroidStudio,目前已兼容11款主流IDE,包括VisualStudioCode、IDEA等。新版插件还针对JavaScript、TypeScript等前端语言进行了优化,提升了代码补全的准确率,使得前端代码生成的采纳率相比旧版提升了20%。CodeFuse插件处于邀请测试阶段,开发者可以在官网申请测试资格。
魔搭社区推出开源版GPTS“ModelScope Agents”
在OpenaiDEVday上,推出了GPTStores,允许用户通过聊天、直接配置的方式进行GPT的定制,可以自定义知识库以及接入web-browsing、文生图、code-interpreter三个工具的能力。魔搭社区表示,开发者的持续反馈展现了GPTStore存在如下待优化点:魔搭社区称,基于上述,希望提供开源的实现方案为开源社区的用户提供类似的应用构建体验,同时方便用户能够接入不同的LLM,方便用户定制;此外,