大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性!且还是自定义那种,16种MBTI都能选。图源备注:图片由AI生成,图片授权服务商Midjourney这样一来,即便是同一个大模型,不同性格下的回答都不一样。请继续关注更多的发展,因为我们继续探索语言模型和人类个性的令人着迷的交汇点。
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍
如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。斯坦福HAI研究所发布了第七个年度的AIIndex报告,这是关于人工智能行业现状的最全面的报告之一。该指数中的其他图表显示,不同人群的观点存在显著差异,年轻人更倾向于乐观地看待人工智能将如何改变他们的生活。
InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”
InstantStyle是由InstantID原班团队推出的一种新的风格迁移方法,它专注于解决图像生成中的风格化问题,即生成与参考图像风格一致的图像。这项技术的核心在于实现风格和内容的有效分离,从在不牺牲内容信息的情况下,注入所期望的艺术风格。随着InstantStyle与InstantID的联名,风格化图像生成的可能性将更加丰富。
GLM团队AI编程助手CodeGeeX插件在Visual Studio上线
GLM大模型团队旗下的CodeGeeX是一款免费的智能编程助手,它最近在VisualStudio平台上线。这使其成为首个适配VisualStudio平台的国产智能编程助手。通过这些功能,CodeGeeX可以帮助程序员节省时间,提高编程效率,甚至提供技术相关的答案和代码错误修复。
斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4
斯坦福大学研究人员发布的Octopusv2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了GPT-4,同时将上下文长度减少了95%。设备端AI智能体时代即将到来,Octopusv2的发布为这一趋势注入了新的活力。
清华创业团队推AI影视创作工具Dream Factory :想法秒变微电影,可长达数十分钟
清华创业团队和卢森堡大学博士研究员合作,开发了一款名为“DreamFactory”的产品,采用创新的多模型智能体协作技术。这项技术让用户只需输入一句话,便能生成完整的剧本和视频,实现了多情节、多场景的“微电影”视频制作。随着技术的不断进步,相信未来会有更多类似的创新产品涌现,为影视行业注入新的活力。
不到半年时间!AI程序员Devin团队Cognition AI 估值或达20亿美元
AI程序员Devin的母公司CognitionAI在不到半年的时间里,估值已经飙升至20亿美元,创始团队拥有10枚IOI金牌,展现出强大的实力。相比之下,其他公司如PerlexityAI和MistralAI在经历多年发展后,估值也只在10亿至20亿美元左右,显示了CognitionAI的迅速崛起和高估值的特殊性。DeepMind创始人Hassiabis也发出警告,指出真正能够改变人类科学的
音乐ChatGPT时刻来临!Suno V3秒生爆款歌曲,12人团队创现象级AI
【新智元导读】以后的爆款歌曲可能要被AI承包了!最近,AI初创公司Suno震撼推出V3音乐生成模型,惊艳了全世界。即可生成2分钟动听的音频。KeenanFreyberg本科毕业于乔治华盛顿大学,后来在多家公司担任运营和产品等职务。
今日AI:Gemini Pro1.5向所有人开放;Stable Diffusion核心团队集体离职;HeyGen5.0上线视频翻译功能;剪映内测视频翻译功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Stable Diffusion核心团队集体离职 AI巨头Stability AI面临财务危机
StableDiffusion的核心研究团队宣布集体离职,这一消息在科技界引起了广泛关注。团队的领导RobinRombach、共同一作AndreasBlattmann以及另一位作者DominikLorenz均在离职名单之上。StabilityAI的未来发展和StableDiffusion项目的前途,成为了业界关注的焦点。
清华大学团队推出RTFS-Net:革新视听语音分离,百万参数实现高效性能
清华大学的胡晓林团队最近推出了一项创新性的视听语音分离方法,称为RTFS-Net。这一方法通过采用压缩-重建的策略,不仅实现了百万参数以下的视听语音分离显著减少了计算复杂度,为音视频分离领域带来了新的视角。这一创新性的视听语音分离方法为提高AVSS性能提供了新的思路,不仅降低了计算复杂度和参数数量在保持显著性能提升的同时,为音视频分离领域注入了更多创新和高效的架构。
什么值得买CTO王云峰:已组建约 50 人大模型自研团队
什么值得买CTO王云峰透露,公司已组建了大约50人的模型自研团队,其中有20人负责数据相关工作,另外30人负责模型、算法、产品构建等方面的工作。公司近期推出的对话式机器人“小值”能够提供口碑总结、商品对比、商品推荐、全网比价等服务。值得买科技在不断探索创新的同时,也将注重用户反馈和市场需求,持续提升自身核心竞争力,推动行业发展。
今日AI:阿里欲推AI电商产品“绘蛙”;北大团队发起复现Sora计划;ComfyUI LayerDiffusion正式上线;AI工具DUSt3R GitHub爆火
北大团队发起复现Sora计划“Open Sora” AnimateDiff大神响应
北大团队联合兔展启动了复现Sora的计划,该项目名为OpenSora。这一举措的背后是资源有限的情况下,团队希望汇集开源社区的力量,以尽可能完成复现工作。这个问题的答案还有待时间的揭晓。
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻
自曝996作息的OpenAI研究员JasonWei表示,Sora代表着视频生成的GPT-2时刻。竞争的关键,就是算力和数据了。从申请表中可以看出,OpenAI正在寻找以下认知科学、化学、生物、物理、计算机、经济学等领域的专家。
尤洋团队开源OpenDiT,训练类似Sora模型实现80%加速
新加坡国立大学尤洋团队最近发布的开源项目OpenDiT,为训练和部署DiT模型提供了新思路。OpenDiT是一个易于使用、快速且内存高效的系统,专门用于提高DiT应用程序的训练和推理效率,包括文本到视频生成和文本到图像生成。易于使用:-通过几行更改实现巨大的性能提升-用户无需了解分布式训练的实现。
GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动
LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。它们该如何与世界进行最佳互动?最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。在表5中,研究人员还发现CodeActAgent在测试的一般LLM任务中表现更好,除了CodeActAgent在MMLU上略有下降。
7B开源数学模型干翻千亿GPT-4,中国团队出品
7B开源模型,数学能力超过了千亿规模的GPT-4!它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。无需借助任何外部工具,它就能在竞赛水平的MATH数据集上达到51.7%的准确率。在X上,已经有人开始在期待Coder和Math的MoE版本了。
GLM团队开源超拟人大模型CharacterGLM 6B版
清华CoAI团队、聆心智能团队、GLM技术团队联手研发了CharacterGLM,一个专门为定制中文AI角色设计的模型,参数规模从6B到66B不等。相较于传统模型,CharacterGLM在表现上更为出色,使用门槛也更低。团队还开发了一款恋爱攻略游戏,名为“哎呦,恋爱怎么这么难!”,进一步展示了CharacterGLM在实际应用中的潜力。
字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA
过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。随着技术的进步,这些方法可能会进一步完善。