ComfyUI插件Steerable Motion更新1.4版本 支持无限量图片输入
SteerableMotion是一个用于通过批次图像控制视频的ComfyUI节点,其设计目标是提供最佳质量和最精确的方法来引导视频模型的进化。它为用户提供了一种新的方法,通过在视频中应用图像的关键帧来实现独特的视觉效果。学习和探索:为了充分利用SteerableMotion,用户需要了解其背后的原理和技术,并通过社区资源、教程以及社交媒体和论坛来提高技能。
Cognition AI官网体验入口 AI软件工程师Devin使用方法教程指南
CognitionAI是一个专注于推理能力的应用AI实验室CognitionLabs开发的软件工程解决方案。该公司旨在通过AI技术提升软件工程的效率,并且已经推出了Devin的AI软件工程师服务。要获取更多详细信息并开始您的软件工程之旅,请访问CognitionAI官方网站。
不到半年时间!AI程序员Devin团队Cognition AI 估值或达20亿美元
AI程序员Devin的母公司CognitionAI在不到半年的时间里,估值已经飙升至20亿美元,创始团队拥有10枚IOI金牌,展现出强大的实力。相比之下,其他公司如PerlexityAI和MistralAI在经历多年发展后,估值也只在10亿至20亿美元左右,显示了CognitionAI的迅速崛起和高估值的特殊性。DeepMind创始人Hassiabis也发出警告,指出真正能够改变人类科学的
专为Stable Diffusion 1.5设计!IP Composition Adapter模型可模仿图片构图
一款名为IPCompositionAdapter的新型适配器引起了广泛关注。该适配器专为StableDiffusion1.5模型设计,其独特之处在于能够在新生成的图像中同步构图忽略风格和内容。随着SDXL变种的研发进展,我们有理由相信,这款适配器将为用户带来更加丰富的创意体验。
量子初创公司 MultiverseComputing 进军人工智能领域 估值翻三倍
西班牙量子软件初创公司MultiverseComputing已经筹集2500万欧元的新资金,将业务重心转移至开发面向人工智能的新产品和服务。这笔资金让该公司的估值增加一倍,达到约1亿欧元,是欧盟量子软件初创公司中单笔融资规模最大的。公司计划今年在欧美多地扩招员工,并将专利数量从现有93项增至150项以上。
谷歌与Singular Computing达成AI专利纠纷和解
谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司SingularComputing从谷歌那里获得了一笔未公开的和解金,这结束了Singular的创始人JosephBates博士对谷歌提起的长达五年的联邦法院专利侵权案。Singular的代表在和解后没有发表任何评论。
ComfyUI-InstantID官网体验入口 无需部署服务器的人物图像生成工具在线使用地址
ComfyUI-InstantID是一个在ComfyUI环境下对InstantID的非官方实现,可以让用户无需部署服务端就可以体验InstantID带来的人物图像生成效果。它支持从huggingfacehub自动下载模型,也可以加载本地模型。点击前往ComfyUI-InstantID官网体验入口获取更多信息并开始创造属于您的人物图像吧!
InstantID in ComfyUI来了!9种风格可选
InstantIDinComfyUI来了!让角色保持变得更加简单高效。只需一张图就可以实现高质量的角色保持还能随心选择多种风格。这些工作流的增加,为用户提供了更多的选择,使用体验更加丰富多彩。
三星Adaptive Color Tone功能正式亮相
三星于1月20日为GalaxyS24系列手机引入了AdaptiveColorTone功能,这一功能是对现有EyeComfortShield的升级版或类似苹果TrueTone的特性。AdaptiveColorTone利用GalaxyS24、GalaxyS24和GalaxyS24Ultra的前置和后置摄像头来根据环境光线条件调整色彩和白平衡。值得一提的是,AdaptiveColorTone功能将与用户使用体验无缝集成,并不断改善用户体验。
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
StabilityAI公司发布了其首个新型人工智能模型,商业许可的StableCode3B。字节复旦团队提出metaprompts扩散模型图像理解力刷新SOTA过去一年,扩散模型逐渐在文生图领域扩展,能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案,旨在提高模型在视觉识别任务中的性能。
Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%
国产开源项目SwiftInfer实现了无限流式输入推理,成功提升了大模型推理性能46%。这是一个重大突破,可以为多轮对话场景提供高效可靠的落地方案。Colossal-AI目前已获得GitHub星数三万五千多颗,位列全球TOP400,细分赛道排名世界第一,可通过高效多维并行、异构内存等,降低AI大模型训练/微调/推理的开发与应用成本,提升模型任务表现,降低GPU需求。
全能自动化工具Activepieces 集成OpenAI、Discord等80多种集成
Activepieces是一个开源的全能自动化工具,被视为流行的自动化平台Zapier的一个替代品。它提供了用户友好的工作流构建器,使用户能够轻松创建和管理自动化工作流。无论是个人用户还是企业用户,Activepieces都能满足他们的自动化需求。
基于GPT-4!Coscientist成功完成复杂化学实验 布洛芬配方轻松拿捏
基于GPT-4的AI系统Coscientist成功在Nature杂志上发表了一篇论文,展示了其在科学研究领域的引人注目的表现。这一新兴的大模型化学家能够自主完成复杂的实验任务,甚至包括2010年诺贝尔化学奖获得者因其研究获奖的钯催化交叉偶联反应。如何平衡人工智能在科学研究中的应用与对专业从业者的潜在影响,将成为科研领域需要认真思考的问题。
继剑桥词典,“幻觉”成Dictionary.com2023年度词汇
Dictionary.com日前宣布,“幻觉”成为2023年度词汇。尽管大多数人可能认为幻觉是人类大脑的一种表现,但Dictionary.com选择这个词汇时实际上是考虑到了人工智能的应用。”他继续说:“‘幻觉’是一个富有表现力的动词,暗示了一个体验与现实脱节的主体。
自主操作计算机框架Self-Operating Computer:用GPT-4V来模拟人类的鼠标点击和键盘输入
自动化技术的最新进展引人瞩目,其中一项引人注目的技术是Self-OperatingComputer框架。这一框架采用了先进的GPT-4V模型,通过模拟人类的鼠标点击和键盘输入,实现了令人惊叹的自主操作。自主操作的计算机框架无疑将改变我们对计算机能力的认知,为未来的科技发展打开崭新的可能性。
IBM宣布以64亿美元收购HashiCorp 加强混合云和生成式人工智能部署
在4月24日的第一季度财报电话会议上,IBM宣布将以64亿美元收购总部位于旧金山的HashiCorp,以加强其混合云和多云产品以及生成式人工智能部署。这一交易预计将于2024年底完成,标志着IBM在扩大混合云、多云和人工智能产品组合方面迈出的重要一步。HashiCorp的产品还可以帮助企业管理生成式人工智能工作负载,成为当今云公司主要驱动力之一。
华为PixArt-Σ放出模型文件 可在Comfyui使用
华为的4K图像模型PixArt-Σ放出了模型文件diffusers也支持了这个架构,用户可以在Comfyui上尝试。尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。PixArt-Σ为用户提供了一种高质量的图像生成工具,能够根据文本提示生成具有特定风格的4K分辨率图像。
AI小镇现在可以通过Llama3在本地运行 支持Convex、Ollama等服务器
a16z团队开发的AI小镇是一个创新的虚拟城镇项目,现在可以通过Llama3完全在本地运行。这个项目不仅支持Convex、Ollama可以支持本地Vite网络服务器,为开发者提供了一个强大的平台来构建和定制自己的虚拟AI社区。凸面使用TypeScript构建,提供了ACID保证、低延迟数据库访问,并支持后台功能,如调度和cron作业。
Cog-Become-Image:将任意人物图像转换成指定风格的图
GitHub上的fofr/cog-become-image项目是一个创新的图像转换工具,它能够将任意人物的面部图像转换成另一种风格的图片。这项技术的应用范围非常广泛,包括但不限于艺术创作、媒体制作和娱乐行业。无论是专业开发者还是技术爱好者,都可以利用这个项目来实现创意图像的转换。
Discord 封禁涉及大规模信息窃取及出售的账户
Discord最近封禁了一批涉及Spy.Pet的账户,这个网站被指控从1.4万个Discord服务器中窃取并出售用户信息。据404Media首先报道,Spy.Pet是一个从数百万Discord用户消息中获取信息,并向愿意付费的人提供访问权限的网站。CEOJasonCitron在给员工的一封邮件中将裁员归咎于公司在疫情期间快速增长。