AI实时对话系统WhisperFusion:集成大模型,与AI无缝语音对话
**划重点:**1.🎙️实时语音转文本:利用OpenAIWhisperLive实现即时将口语转换为文本。2.🧠大型语言模型整合:集成Mistral大型语言模型,提升对转录文本的理解和上下文把握。-推理加速:利用torch.compile对WhisperSpeech进行优化,通过即时编译PyTorch代码,进一步加快了处理速度。
ChatGPT Plus 专属的「语音对话」功能现已向所有免费用户开放
ChatGPT的语音功能现已免费向所有用户开放。在一篇发布在X上的帖子中,OpenAI宣布用户现在可以通过点击耳机图标,在移动应用中使用他们的声音与ChatGPT交谈,并获得语音回复。Brockman也对重返OpenAI持开放态度。
TomTom 与微软合作开发车载 AI 对话助手只需一次对话交互即可完成所有操作
地图/导航公司TomTom宣布,已与微软合作开发了一款车载人工智能对话助手。该工具通过增强的语音互动,提升了信息娱乐系统、位置搜索和车辆命令系统的体验,并在一个集成语音AI应用日益增多的一年结束时推出。」这包括从预设菜单上点餐或在临床医疗环境中进行环境记录等任务。
行业首创!广汽“昊铂大模型座舱”开启公测招募:支持智能语音交互
快科技11月2日消息,我们从昊铂官方了解到,旗下昊铂大模型座舱”将于11月2日-15日开启公测招募。本次招募面向已提车的昊铂 GT 用户,是 OTA 正式版本发布前的抢先体验活动。值得一提的是,该测试版本可能存在一定的不稳定性。据悉,广汽 AI 大模型平台将率先落地智能语音交互场景。基于该平台,智能语音可结合各种模型优势,运用车端本地推理能力和云端混合模型技术�
西工大提出全新自主无人机控制框架 实现类人对话交互
西工大的李学龙教授团队提出了一种全新的自主无人机控制框架,采用大模型实现了无人机之间的「群聊式」对话交互,从打破了人机交互的壁垒,提高了无人机任务执行的自主性。这一框架包括了类人对话交互、主动环境感知和自主实体控制等核心要点,使无人机能够更好地理解用户需求、实时感知外部环境并调整任务规划,以及自主控制执行任务。这一大模型自主无人机集群技术的应用潜力广泛,包括安防巡检、灾害救援和空中物流等领域,对未来的自主智能体研究具有重要意义。
英伟达AI游戏引擎炸场CES!NPC与玩家实时交互,对话动作流畅似真人
《赛博朋克2077》里的NPC,已经会和玩家对话了?还是根据玩家说的话实时响应,不用背剧本的那种?在CES2024的活动上,英伟达展示了利用AvatarCloudEngine技术打造的最新成果。在ACE的加持之下,游戏中的人物纷纷“活”了起来,与其他角色甚至真人玩家一起对话交流,并根据对话内容做出动作。腾讯、网易、米哈游等游戏大厂也纷纷宣布将会跟进。