EMO同款?微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频
由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。这项技术不仅能够实现音频与唇部动作的精确同步能够捕捉并再现丰富的面部表情和自然的头部动作,极大地增强了生成视频的真实感和生动性。所有在演示中使用的肖像图像,除了蒙娜丽莎外,都是由StyleGAN2或DALL-E-3生成的虚拟、不存在的身份
百度三大AI开发神器亮相!李彦宏:只要会说话就能成开发者
在今天的Create2024百度AI开发者大会上,百度创始人、董事长兼CEO李彦宏发表了人人都是开发者”的主题演讲。李彦宏认为,过去开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。ModelBuilder更适合专业开发者使用,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,这样就能达到更好的效果。
腾讯开源对口型工具AniPortrait 让照片唱歌说话
AniPortrait是一个创新的项目,它能够基于音频和一张参考人脸照片来生成高品质的动画。这个项目的工作原理分为两个步骤。虽然它可能没有EMO演示的那么好,但是它直接开源,对于有需求的用户来说,可以直接使用。
虚拟角色平台Character AI的生成式AI聊天机器人可以说话了
CharacterAI最近为其生成式AI聊天机器人增加了语音功能。全新的CharacterVoice功能使用户能够真正听到他们正在对话的合成人物的声音,旨在提升用户体验的参与感。该平台还扩大了其适用范围,超出了网络门户,并成为亚马逊Alexa早期添加的生成式AI技能之一。
姜武入驻抖音:辟谣4岁才会说话 直呼倍速看视频是神奇发明
演员姜武3月18日入驻抖音,短短两天,粉丝已经突破32万,首个视频点赞破56万。姜武辟谣了网上关于自己4岁才会说话的传言,调侃4岁就4岁吧,别传成10岁就行”。在姜文导演的电影《让子弹飞》中,姜文饰演张麻子,姜武饰演武举人。
李彦宏称“程序员”职业将不复存在:会说话就能当程序员!
在昨天央视的《对话》开年说节目上,百度创始人、董事长兼CEO李彦宏表示,未来只要会说话就能具备今天程序员所具备的能力。当被问及未来两年大模型会给人类的生产生活带来什么改变时,李彦宏回答道:我认为大模型对于人类生产生活的改变会是非常根本性的。”互联网改变了我们的很多生活,但是这一波人工智能的改变,会更加的彻底、更加的深刻。李彦宏表示:基�
阿里通义实验室开源多模态说话人项目3D-Speaker
3D-Speaker是通义实验室语音团队贡献的一个开源项目,结合了声学、语义、视觉三维模态信息来解决说话人任务。项目涵盖了说话人日志、说话人识别和语种识别任务,提供了工业级模型、训练代码和推理代码。3D-Speaker项目在说话人任务中探索了多模态信息的结合应用,提供了一系列有效的技术解决方案和开源资源,为语音研究领域的发展做出了贡献。
大学生返校时的高铁车厢能有多安静:没人说话 堪比静音车厢
过了元宵节,这个年算真正过完了,近日,全国多数高校开学,许多网友分享了大学生返程列车内的景象。根据网友拍摄的视频,车厢没有聊天声音和电话声,大学生都很默契的保持安静,环境堪比静音车厢。若多次劝说无果,工作人员也会采取强制措施”,引导乘客前往非静音车厢等。
Rabbit tech开发AI系统LAM 说话就能指挥系统完成任何APP操作
Rabbittech近期开发了一个全新的基于人工智能的系统,它能够模拟和推断人类行为,并在计算机应用程序中执行可靠和快速的操作。这个系统被称为大型行动模型,并且非常适合部署在各种人工智能助手和操作系统中。这一功能使得这个系统比之前的AIPin更加可靠和便捷。
阿里AI项目DreamTalk开源 可让人物头像说话
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。该框架适用于多种场景,可以用于歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。
清华阿里等共同开发基于扩散模型的框架DreamTalk 可以让人物头像说话
DreamTalk是一个由清华大学、阿里巴巴和华中科大共同开发的基于扩散模型的框架,可以让人物头像说话、唱歌并保持嘴唇的同步和模仿表情变化。项目地址:https://dreamtalk-project.github.io/这一框架具有以下特点:DreamTalk能够生成高质量的动画,使人物脸部动作看起来非常真实。DreamTalk是一个具有创新技术的框架,能够为人物头像赋予说话和表情的能力,为多种领域带来更加生动和丰
AI系统可将意念转化为文本:帮助无法说话的人沟通
澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤无法说话的人进行沟通,也有望实现人与仿生手臂或机器人等设备之间的无缝通信。最新技术既可使用眼动追踪,也可不使用眼动追踪。
DIRFA:只需音频和照片即可创建逼真的说话脸部动画
新加坡南洋理工大学的一支研究团队开发了一个计算机程序,只需音频和一张照片,即可创建反映说话者面部表情和头部动作的逼真视频。这个名为DIverseyetRealisticFacialAnimations的人工智能程序能够根据音频和照片生成3D视频,显示人物与所说的音频同步的逼真一致的面部动画。”除了向DIRFA的界面添加更多选项和改进外,NTU的研究人员还将使用更广泛的数据集来微调其面部表情�
用数据说话!小鹏公布AEB测试成绩单
我们从小鹏汽车官方微博获悉,在正规测试中,小鹏自研AEB的成绩接近满分。小鹏汽车表示:AEB是主动安全的一项重要分支,小鹏全系标配,无需智驾版。日间、夜间行人保护科目中获得了8.7分,得分率达到了96.7%,小鹏P7也成为了同时获得EuroNCAP和C-NCAP认证的双五星车型。
黑照变废为宝!超能AI一句话修出创意大片,亲妈看了都说真
2024最wow的AI生图工具出现了!对“青春纪念手册”下手,你就说这味儿正不正宗:不信谁没有,谁也别说谁。下一秒“啪”的一下:……什么情况?这,就是最近摄影圈不少人都在玩的AI修图神器——超能画布。有木有被戳到,不妨亲自动手试试。
雷军一句话凡客又活了!同款鞋服均已卖断货
快科技4月19日消息,昨天下午,雷军在抖音开启了直播,对于网友关注的话题进行了回应。对于大家都说他模仿马斯克、乔布斯的话题,雷军直呼冤枉,并称:我穿的其实就是工程师平时穿的,凡客的T恤,凡客的牛仔裤,凡客的帆布鞋。”这几个凡客说出口,凡客多个直播间的流量迅速暴涨3-5倍,在雷军直播结束后,有超过18万人涌入凡客的直播间,并且直播间的多款产品也�
百度文库上线“智能漫画”“智能画本”功能 可一句话生成漫画
百度文库在2024年的Create2024百度AI开发者大会上发布了全新的「智能漫画」和「智能画本」功能,标志着内容创作迈入了跨模态时代。这些功能让用户只需输入一句话就能在几分钟内创作出漫画或画本,从创意激发到内容生成实现了全链路创作路径的打通。「智能画本」功能则让父母能够为孩子创作图文并茂、人声朗读的视频。
一句话打造Agent!李彦宏:人人都是开发者的时代到来
大模型颠覆一切,终于还是颠到了本小编头上。还是一个一句话就被打造出来的Agent。超级个体时代,我们手握AI技术面对的,不仅是一场技术的革命,更是一次个体可能性的全面释放。
一句话P视频成现实!OpenAI Sora加入Adobe全家桶
近日Adobe宣布计划在年内推出由生成式AI加持的PR,遗憾的是官方并未公布具体时间。根据Adobe官方演示,AI加持的PR实现了一句话就能P视频,用户只需输入文本提示词,就能添加、改变和删除物体,增加辅助镜头,甚至还能把某个镜头延长几帧。PS的AI功能思路上和P有些类似,都是通过文字提示词,让一些人类觉得麻烦的细节处理起来更加简单,例如添加内容、移除或替换图像的一部分、扩展图像等等。
雷军被小米食堂一句话感动:社会的边角料 大家的小骄傲
今日一段小米食堂的内部演讲视频在网络上走红。雷军通过个人微博转发视频称:最后一句话特别感人,社会的边角料,大家的小骄傲”。初期产能不足限量发售”被质疑饥饿营销”技术革新提高产能”等等一系列米式”金句层出不穷,连雷军在场下也忍不住啊哈哈大笑,比部分手机发布会氛围还好。