谷歌推多模态视频模型VLOGGER,自动生成丰富动作视频
谷歌的研究人员最近推出了一款名为VLOGGER的多模态扩散模型,能够自动生成带语音、丰富动作的人物视频。用户只需向VLOGGER输入图像和语音,就可以获得逼真的视频效果。VLOGGER的推出为虚拟数字人的制作提供了更便捷、高效的解决方案,同时也在多模态视频生成领域取得了重要的技术突破。
今日AI:suno v3模型要抢歌手饭碗?字节发布AnimateDiff-Lightning模型;谷歌发布Vlogger视频模型;博主用AI做长篇漫画上架腾讯
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌发布 “Vlogger” 视频模型框架:单张图片生成 10 秒视频
谷歌最近发布了一项名为“Vlogger”的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。随着技术的不断进步和完善,相信Vlogger将在未来有更广泛的应用和发展。
EMO同款?谷歌推对口型视频工具VLOGGER 还具备视频编辑功能
科技巨头们正在竞相开发能够从单张照片生成会说话的人类视频的技术。继阿里巴巴推出其EMO项目后,Google也推出了类似的项目VLOGGER。与阿里巴巴的EMO相比,VLOGGER在视频生成的效果上还有待提升。
VLOGGER官网体验入口 AI视频生成工具在线使用地址
VLOGGER 是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。我们的方法包括1)一个随机的人类到3D运动扩散模型,以及2)一个新颖的基于扩散的架构,通过时间和空间控制增强文本到图像模型。这种方法能够生成长度可变的高质量视频,并且通过对人类面部和身体的高级表达方式轻松可控。与以前的工作不同,我们的
BlogGenie官网体验入口 AI写作辅助免费软件app下载
《BlogGenie》是一个基于AI的写作辅助工具,能够自动分析YouTube视频内容,抽取关键信息,并生成初稿博客文章。用户只需输入视频网址,BlogGenie就可以在几秒内返回高质量的博客草稿。以上就是《BlogGenie》的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验!
OceanBase 4.3版本推出列式存储引擎,进一步加强TP/AP一体化
OceanBase在其“关键业务负载”的一体化战略上再迈一步。4月20日在第二届OceanBase开发者大会上,OceanBase发布4.3版本,推出全新列式存储引擎,打造PB级实时分析数据库,可实现秒级实时分析,进一步加强TP/AP一体化。在OceanBase的开源社区,目前已有118位开发者开通博客,累计有1000多篇技术文章分享,核心仓库拥有300多位外部贡献者,共建代码量超5万行。
首创情感引擎!蔚来车载人工智能车载NOMI将迎升级
蔚来今日正式推出了全新的NOMIGPT大模型,该模型基于全新技术架构打造,将为蔚来用户带来了前所未有的智能体验。此次升级中,蔚来为NOMI量身打造了端云多模态大模型,集成了自研多模态感知、认知中枢、情感引擎以及多专家Agent等多项先进功能。这使得NOMI的每一句对话、每一个表情都符合其基本人设,并随着陪伴时间的增长,与用户的关系更加契合,为用户提供更加自然、真实的交互体验。
Uppply官网体验入口 AI工作搜索引擎求职平台使用地址
Uppply是一个革新性的工作搜索引擎,以求职者为中心提供个性化的职位推荐和申请跟踪功能。它汇集了来自全球各地的85000多个活跃职位机会,涵盖软件工程、数据科学、管理、医疗保健等多个领域。Uppply产品特色:个性化职位推荐申请跟踪功能85000全球活跃职位多领域职位选择简洁直观的用户界面想要探索更多Uppply的功能和优势,请访问官方网站。
AI人声合成引擎ACE Studio 可修改Suno生成的音乐甚至替换歌手的声音
ACEStudio是一款尖端的AI人声合成引擎,其设计理念是创造出既自然又富有感情的类真人歌声。这款引擎运用了最前沿的AI技术,将人工智能融入声音生成的每一个环节,力求让合成出来的声音尽可能地接近真实人声的表现力和情感深度。ACEStudio为音乐制作人提供了强大的工具,使他们能够在创作中发挥更大的想象力和创造力,同时以高品质的人声为作品增添灵魂和情感。
OpenAI公开语音合成引擎Voice Engine:支持语音克隆,未开放使用
OpenAI近日分享了一个名为VoiceEngine语音合成模型的初步结果。VoiceEngine支持语音克隆,但是未开放使用,提供给了HeyGen等公司使用。OpenAI希望通过与各方合作,加强社会对合成语音技术带来的挑战的防范,促进对合成语音技术的了解和应用。
奇瑞被奔驰男砸引擎盖原视频公布 网红“五莲徐八月”致歉
前段时间,奇瑞被奔驰男砸引擎盖”一事,引起网友关注热议,砸车的奔驰男被罚款并拘留。时隔两个月后,网红@五莲徐八月日前再次回应和奔驰车的纠纷事件,称跟所有关心这件事的人说抱歉,这件事占用了太多的公共资源”。向那些因为妈妈是司机同情我们的粉丝”说声对不起,我因思虑不周说的话,伤害了你们的善良。
马斯克四年来第三次成世界首富 AI成为财富增长新引擎
备受瞩目的《2024胡润全球富豪榜》正式发布,该榜单以2024年1月15日为财富计算截止日期,全面展现了全球富豪的财富格局。胡润百富董事长兼首席调研官胡润在发布会上表示,今年AI技术首次深度影响了全球富豪榜,超过一半的新增财富来源于此领域。随着科技的不断发展,AI领域将继续成为财富增长的新引擎,引领全球富豪榜的新变化。
颠覆任天堂?首个AI游戏引擎Buildbox 4 Alpha问世
近期GTC2024大会后,黄仁勋指出未来5-10年,游戏将彻底由AI生成,Buildbox4Alpha作为首个AI游戏引擎已经问世。这一引擎通过简单的文字提示,能够创造出游戏所需的各种资产和动画无需编写一行代码。这将为游戏行业带来新的机遇和挑战,也将推动游戏产业的进一步发展。
开发效率提升100倍!腾讯自研游戏AI引擎GiiNEX发布
据GiiNEX游戏AI引擎”公众号介绍,在2024全球游戏开发者大会上,腾讯发布自研游戏A引擎GiiNEX。GiiNEX利用大模型等生成式AI技术,面向AINPC、场景制作、内容生成等多个场景提供支持。GiiNEX利用大模型等生成式AI技术,为玩家提供了一系列游戏内可用的UGC关卡设计工具,并已在游戏《元梦之星》上线。
腾讯发布自研游戏AI引擎:3D城市布局效率提升百倍,UGC工具已上线《元梦之星》
现在连引擎都有AI味儿了——就在游戏开发者大会上,腾讯刚刚发布自研游戏AI引擎GiiNEX。基于生成式AI和决策AI技术,GiiNEX可以支持游戏从研发到运营的全生命周期需求。围棋AI“绝艺”、会打王者荣耀的“绝悟”都来自于该团队。
OpenAI CEO:对挑战搜索引擎领域没兴趣 太小儿科
OpenAICEO山姆阿尔特曼最近表示,自己对挑战搜索引擎领域没有兴趣。阿尔特曼称,首先我们要评估能否打造一个比谷歌或者其它公司更优秀的搜索引擎,答案是肯定的。谷歌这边则是推出了聊天机器人Bard,现已更名为Gemini,像是程序编写、逻辑推理、遵循细微与精确的指示,以及进行创意协作,对标OpenAI。
智能搜索引擎Perplexity整合“美版大众点评”Yelp数据,提供餐厅建议
智能搜索引擎Perplexity日前宣布与Yelp合作,为其聊天机器人提供实时餐厅建议。Perplexity的CEOAravindSriniva表示,越来越多的人将聊天机器人用作常规搜索引擎,因此将餐厅等信息直接从源头提供是合理的选择。值得注意的是,Perplexity的Yelp整合也在移动端可用。
Meta打造巨型AI模型 为视频推荐引擎注入新活力
互联网巨头Meta正致力于开发一款超大规模的人工智能系统,旨在为其旗下的视频推荐引擎注入新的活力,从提升用户体验。Facebook的负责人汤姆·埃利森透露,这款巨型人工智能推荐模型是Meta到2026年技术路线图的关键组成部分。这一举措不仅彰显了Meta在人工智能领域的雄心壮志,也为整个行业的发展注入了新的活力。
Perplexity官网体验入口 人工智能AI搜索引擎免费在线使用地址
Perplexity是一款提高助手使用效率的工具,支持上传文本或PDF文件,并升级到GPT-4。它可以作为个人搜索助手,帮助用户快速找到所需信息。想了解更多关于Perplexity工具的信息并体验其强大功能,请访问Perplexity官方网站。