百度三大AI开发神器亮相!李彦宏:只要会说话就能成开发者
在今天的Create2024百度AI开发者大会上,百度创始人、董事长兼CEO李彦宏发表了人人都是开发者”的主题演讲。李彦宏认为,过去开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。ModelBuilder更适合专业开发者使用,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,这样就能达到更好的效果。
姜武入驻抖音:辟谣4岁才会说话 直呼倍速看视频是神奇发明
演员姜武3月18日入驻抖音,短短两天,粉丝已经突破32万,首个视频点赞破56万。姜武辟谣了网上关于自己4岁才会说话的传言,调侃4岁就4岁吧,别传成10岁就行”。在姜文导演的电影《让子弹飞》中,姜文饰演张麻子,姜武饰演武举人。
李彦宏称“程序员”职业将不复存在:会说话就能当程序员!
在昨天央视的《对话》开年说节目上,百度创始人、董事长兼CEO李彦宏表示,未来只要会说话就能具备今天程序员所具备的能力。当被问及未来两年大模型会给人类的生产生活带来什么改变时,李彦宏回答道:我认为大模型对于人类生产生活的改变会是非常根本性的。”互联网改变了我们的很多生活,但是这一波人工智能的改变,会更加的彻底、更加的深刻。李彦宏表示:基�
打破教育界限!印度首位人工智能教师“上岗”:会说三种语言
印度首位人工智能教师爱丽丝已经在喀拉拉邦一所学校正式上岗”。爱丽丝”由印度Makerlabs教育科技公司开发,是一款基于生成式AI技术的人形机器人。爱丽丝”的主要授课范围为教授幼儿园至中学课程。
第二代Ameca来了!和观众对答如流,面部表情更逼真,会说几十种语言
全新升级的第二代Ameca来了,GPT-4加持,能够实时对答。人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。Ameca还是一个多才多艺的机器人,能够流畅地画出一只猫。
EMO同款?微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频
由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。这项技术不仅能够实现音频与唇部动作的精确同步能够捕捉并再现丰富的面部表情和自然的头部动作,极大地增强了生成视频的真实感和生动性。所有在演示中使用的肖像图像,除了蒙娜丽莎外,都是由StyleGAN2或DALL-E-3生成的虚拟、不存在的身份
腾讯开源对口型工具AniPortrait 让照片唱歌说话
AniPortrait是一个创新的项目,它能够基于音频和一张参考人脸照片来生成高品质的动画。这个项目的工作原理分为两个步骤。虽然它可能没有EMO演示的那么好,但是它直接开源,对于有需求的用户来说,可以直接使用。
虚拟角色平台Character AI的生成式AI聊天机器人可以说话了
CharacterAI最近为其生成式AI聊天机器人增加了语音功能。全新的CharacterVoice功能使用户能够真正听到他们正在对话的合成人物的声音,旨在提升用户体验的参与感。该平台还扩大了其适用范围,超出了网络门户,并成为亚马逊Alexa早期添加的生成式AI技能之一。
阿里通义实验室开源多模态说话人项目3D-Speaker
3D-Speaker是通义实验室语音团队贡献的一个开源项目,结合了声学、语义、视觉三维模态信息来解决说话人任务。项目涵盖了说话人日志、说话人识别和语种识别任务,提供了工业级模型、训练代码和推理代码。3D-Speaker项目在说话人任务中探索了多模态信息的结合应用,提供了一系列有效的技术解决方案和开源资源,为语音研究领域的发展做出了贡献。
大学生返校时的高铁车厢能有多安静:没人说话 堪比静音车厢
过了元宵节,这个年算真正过完了,近日,全国多数高校开学,许多网友分享了大学生返程列车内的景象。根据网友拍摄的视频,车厢没有聊天声音和电话声,大学生都很默契的保持安静,环境堪比静音车厢。若多次劝说无果,工作人员也会采取强制措施”,引导乘客前往非静音车厢等。
Rabbit tech开发AI系统LAM 说话就能指挥系统完成任何APP操作
Rabbittech近期开发了一个全新的基于人工智能的系统,它能够模拟和推断人类行为,并在计算机应用程序中执行可靠和快速的操作。这个系统被称为大型行动模型,并且非常适合部署在各种人工智能助手和操作系统中。这一功能使得这个系统比之前的AIPin更加可靠和便捷。
阿里AI项目DreamTalk开源 可让人物头像说话
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。该框架适用于多种场景,可以用于歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。
清华阿里等共同开发基于扩散模型的框架DreamTalk 可以让人物头像说话
DreamTalk是一个由清华大学、阿里巴巴和华中科大共同开发的基于扩散模型的框架,可以让人物头像说话、唱歌并保持嘴唇的同步和模仿表情变化。项目地址:https://dreamtalk-project.github.io/这一框架具有以下特点:DreamTalk能够生成高质量的动画,使人物脸部动作看起来非常真实。DreamTalk是一个具有创新技术的框架,能够为人物头像赋予说话和表情的能力,为多种领域带来更加生动和丰
AI系统可将意念转化为文本:帮助无法说话的人沟通
澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤无法说话的人进行沟通,也有望实现人与仿生手臂或机器人等设备之间的无缝通信。最新技术既可使用眼动追踪,也可不使用眼动追踪。
DIRFA:只需音频和照片即可创建逼真的说话脸部动画
新加坡南洋理工大学的一支研究团队开发了一个计算机程序,只需音频和一张照片,即可创建反映说话者面部表情和头部动作的逼真视频。这个名为DIverseyetRealisticFacialAnimations的人工智能程序能够根据音频和照片生成3D视频,显示人物与所说的音频同步的逼真一致的面部动画。”除了向DIRFA的界面添加更多选项和改进外,NTU的研究人员还将使用更广泛的数据集来微调其面部表情�
用数据说话!小鹏公布AEB测试成绩单
我们从小鹏汽车官方微博获悉,在正规测试中,小鹏自研AEB的成绩接近满分。小鹏汽车表示:AEB是主动安全的一项重要分支,小鹏全系标配,无需智驾版。日间、夜间行人保护科目中获得了8.7分,得分率达到了96.7%,小鹏P7也成为了同时获得EuroNCAP和C-NCAP认证的双五星车型。
花花挣的工资有一大半是委屈费 有些游客说话不太友善
在四川成都,大熊猫繁育研究基地的明星大熊猫花花成为了无数游客的心头好,但她的名气也带来了困扰。作为“网红”大熊猫,每天接待成千上万的游客,然,有些游客对她的外貌评头论足,甚至说出不友善的话语,使花花感到不快。这是一种对生物多样性的尊重,也是对自然界的珍惜。
AI仅凭听患者说话就能检测糖尿病 准确率近90%
最新医学研究表明,人工智能可以通过仅仅听取患者说话6-10秒的声音来检测2型糖尿病。这一突破性研究由KlickLabs进行,结果显示在女性中的准确率达到89%在男性中为86%。这一消息紧随麻省理工学院最近的突破性研究,该研究开发了一种能更顺畅地适应人体的生物植入物,有助于胰岛素等药物的传递。
6万粉丝,带货16万单!
各位村民好,我是村长在绝对力量面前,所有的赚钱套路都不堪一击。今天和大家分享一个好物带货的案例,希望对大家有一些启示。01图文好物也能带货在抖音提到好物带货,大家立马想到的就是短视频和直播。但其实还有一种更传统的带货方式——图文好物带货。就是以图片的形式,分享产品的细节图片,一般3-5张,会配上一些音乐和文字,风格偏向小红书。因为大家平常
4000万粉丝IP,倒在了2024年春天
又一位头部网红遭遇全网封禁。@Thurman猫一杯因《秦朗寒假作业本》视频遭到行政处罚,并被视频号、抖音等多个平台封禁,原因是“与同事共同策划、编造视频”。如果让卡思为猫一杯事件总结教训,那应该就是:从2024年开始,虚构剧情即使没有让任何自然人受到名誉或财产伤害,也要承担社会责任,轻则道歉掉粉,重则封号退网,这是头部博主们必须警惕的边界线。