OpenAI在API新增”项目“功能,可精细化管理模型
4月17日,OpenAI在社交平台宣布,在API仪表盘中新增“项目”管理功能,帮助企业、个人开发者更精细化的管理、跟踪模型。项目的功能包括,模型的选择、功能、线程、助手、模型微调、数据存储等,同时可以将创建的API项目与团队中的其他成员共享。每个组织都会有一个“默认项目”,无法配置限制或重命名,无法添加成员和服务帐户,并且它继承组织的完整配置。
开源移动短视频项目Douyin Vue 提供与TikTok相媲美的流畅体验
DouyinVue是一个开源的移动短视频项目,旨在模仿流行的TikTok应用。该项目利用Vue3、Vite5和Pinia等前端技术,提供了与原生应用相媲美的流畅用户体验,是一个展示Vue在移动开发中应用的绝佳案例。它提供了一个基础框架,开发者可以在此基础上添加新功能或进行个性化定制。
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2不再依赖庞大的GPT-2库。他本人预告,即将上线新课。等着这一切完成之后,另一期「从头开始构建」的视频也会上线。
谷歌发布图像局部重绘项目ObjectDrop 插入物体和环境完美融合
谷歌今天发布了一个名为ObjectDrop的图像局部重绘项目,其效果令人印象深刻。这个项目成功模拟了物体对场景的影响,包括遮挡、反射和阴影,实现了逼真的物体移除和插入。这一成果对于图像处理和计算机视觉领域来说,是一个重要的突破。
生成式AI指南体验入口 awesome-generative-ai-guide项目地址入口
awesome-generative-ai-guide是一个集中存放生成式人工智能相关资源的中心,包括每月最新研究论文、面试题库、课程材料、代码笔记本等。内容定期更新,旨在让开发者及从业人员能够及时跟进最新进展,提高生产力。人工智能爱好者对生成式AI感兴趣,想进一步学习相关知识,可以从列出的免费在线课程中选择合适的课程。
腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人
腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面有了这个项目以后,就可以实现多人合照了。我们期待看到更多的研究成果在这个领域出现。
用Vision Pro实时训练机器狗,MIT博士生开源项目火了
VisionPro又现火爆新玩法,这回还和具身智能联动了~就像这样,MIT小哥利用VisionPro的手部追踪功能,成功实现了对机器狗的实时控制。不仅开门这样的动作能精准get:也几乎没什么延时。作者本人也在论文中写道:最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台VisionPro之外需要准备:苹果开发者账户VisionPro开发者配件安装了Xcode的Mac电脑嗯,看样子还是得先让苹果赚一笔了。
aiwechat-vercel官网体验入口 AI微信公众号集成AI功能开源项目免费使用地址
aiwechat-vercel是一个使用vercel的functions,将ai功能加入微信公众号的开源项目。它提供支持接入gpt、星火、通义千问、gemini等AI功能,具有超时回复、连续问答、图床功能等特点。要了解更多关于aiwechat-vercel的信息并开始使用该工具,请访问aiwechat-vercel官方网站。
MIT博士生用Vision Pro实时训练机器狗 开源项目Tracking Steamer火了
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
ControlNet作者新作:AI绘画能分图层了,项目未开源就斩获660 Star
“绝不是简单的抠图。”ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用StableDiffusion可以直接生成单个或多个透明图层!例如来一句:可以看到,AI不仅生成了符合prompt的完整图像,就连背景和人物也能分开。毕竟张吕敏也被网友调侃为“时间管理大师”,对LayerDiffusion感兴趣的小伙伴可以提前mark一波了。
OpenDiT:一个用来加速类似Sora的DiT架构模型训练和推理项目
OpenDiT是一个针对DiT训练和推断的高性能系统,它通过Colossal-AI提供支持,并以提高效率为目标。该系统通过优化内核、采用混合并行方法以及引入FastSeq等技术,能够显著提高GPU计算速度并降低内存占用,为DiT应用带来了巨大的性能提升。OpenDiT的出现为DiT应用的训练和推断提供了便利,其高效的实现方式和简单易用的接口使得用户可以更加专注于应用场景和算法的研究无需过多
每日AI:爆打Sora?谷歌发布世界模型Genie;AI画出奥特曼被判侵权;Mistral Large模型正式发布;OpenAI 秘密项目 Feather曝光
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI视野:英伟达推文生图模型ConsiStory;高度可控AI试衣OOTDiffusion;开发者推SoraWebui开源项目;Groq最快AI推理芯片成本推算高得离谱
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
离开OpenAI待业的Karpathy推出大模型新项目minbpe
Karpathy离开OpenAI后并未放松,快速推出了新项目minbpe。该项目的GitHub标星数量在短短一天内就突破了1.2k,展现出了巨大的关注度和吸引力。相信随着项目的不断发展和完善,minbpe将在人工智能领域发挥重要作用,为行业的进步和发展贡献力量。
AI视野:OpenAI推新模型GPT-4-0125-preview;阿里Qwen-VL升级更新;苹果播客新增转录功能;AI写真项目InstantID在GitHub爆火
贾扬清周末项目Lepton Search登顶GitHub热榜 500行代码打造
贾扬清在周末项目LeptonSearch登顶GitHub热榜,展示了使用500行代码打造AI搜索引擎的能力。LeptonSearch作为一个Demo演示,旨在向开发者展示简洁高效的实现方式。LeptonSearch的出现无疑为AI搜索引擎领域带来了新的思路和可能性,也引发了行业内外的讨论和关注。
摩尔线程复原阿里的单图跳舞项目Moore-AnimateAnyone 用户可训练自己的AnimateAnyone模型
摩尔线程的单图跳舞项目已经复原,并且已经开源训练代码。这意味着你现在可以使用自己的AnimateAnyone模型进行训练。通过这个项目,用户可以轻松地获取Moore-AnimateAnyone的实现,并在ComfyUI中使用。
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
StabilityAI公司发布了其首个新型人工智能模型,商业许可的StableCode3B。字节复旦团队提出metaprompts扩散模型图像理解力刷新SOTA过去一年,扩散模型逐渐在文生图领域扩展,能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案,旨在提高模型在视觉识别任务中的性能。
阿里推新项目MotionShop 可将视频中的角色替换为3D
阿里巴巴推出了名为MotionShop的新项目,这一项目可以将视频中的角色替换为3D化身。MotionShop利用先进的视频处理和3D渲染技术,能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。第一步:上传一个包含人物的视频;第二步:选择视频中要替换的人物;第三步:选择要替换的虚拟角色模型并点击生成,等待10分钟即可生成结果。
开源项目Open Interpreter:让AI在操作系统中自我复制
一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目OpenInterpreter,AI实现了在操作系统级别启动自身副本的雏形。在短短48小时内,超过200位工程师和设计师愿意加入项目,展现了社区对于这一创新的积极响应。