谷歌多模态图像生成模型Instruct-Imagen 整合LLM和SD生态
谷歌的Instruct-Imagen模型展现了多模态图像生成领域的强大力量,成功整合了大型语言模型和现有的自监督学习生态系统。这一模型的核心优势在于其能够通过自然语言和输入内容智能地调用SD生态系统中的各种模型,实际上,相当于利用LLM将SD生态中的Lora和Controlnet等模型打造成智能Agents。这一技术创新为实现更广泛、更智能的图像生成任务打开了新的可能性。
runway可以让人物面部生成指定表情
runway官方账号宣布运动笔刷功能升级,通过运动笔刷与提示词结合,可以实现对人物面部表情的精准控制。通过这项技术,运动笔刷可以根据提示词快速准确地在人物面部产生指定的表情,比如开心、恐惧等。这一创新不仅省去了复杂的视频编辑软件的使用,也摆脱了冗长的制作流程,让影片创作变得更加高效。
可行驶在任何星球表面!特斯拉Cybertruck电动皮卡首批正式交付
今天凌晨,特斯拉在得克萨斯州举办了交付活动,终于正式交付了首批Cybertruck电动皮卡。Cybertruck不含优惠的起售价为60,990美元,特斯拉预估计入税收抵免等优惠后的价格可能低至49,890美元。作为可跨越星球的汽车,自然少不了生物武器防御模式,新车同样配备医疗级别的HEPA高效空气过滤系统,可有效过滤99.97%的空气微粒。