快手内测“AI小快” 提供评论智能回复功能
快手宣布正式开始内测一项名为“AI小快”的新功能,该功能将为用户在短视频评论区提供基于短视频应用场景的多种AIGC服务,包括互动问答、图片生成、攻略检索和文案修改等。“AI小快”采用快手自主研发的大规模语言模型“快意”大模型作为基础。“AI小快”功能的推出是快手在人工智能领域的一次重要尝试,将为用户带来更好的互动体验,也将为快手未来的发展带来更多机遇。
AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
AssemblyAI最新研究成果展示了他们的Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。Universal-1比WhisperLarge-v3更准确,比fastWhisper更快,38秒可以处理60分钟音频。值得一提的是,非开源,仅提供API调用。
超快!Deepgram Aura:实时文本转语音API 低于250毫秒
DeepgramAura是一款实时文本转语音API,其主要特点是低延迟,不超过250毫秒,能够即时响应用户的需求。它还具备人类般对话的自然度和流畅度,包括自然的节奏和停顿,能够根据对话上下文动态调整音调和情绪,使得对话更加生动和真实。DeepgramAura是一款性能优越的实时文本转语音API,具备低延迟、自然对话流畅和实时互动等特点,适合各种场景下的应用,为用户提供了高效�
元象推出高定制语音方案 克隆语音最快只需5分钟数据
元象推出了高度定制的语音方案,通过多重技术手段实现高自然度的语音交互体验。该方案可以应用于客服、虚拟IP、直播、有声书、语音助手等领域。让模型多“听”,提高其对不同情境的适应能力,增强泛化能力。
谷歌Gmail新功能“Help Me Write”将很快支持语音输入
谷歌的人工智能辅助电子邮件起草功能“HelpMeWrite”即将迎来语音输入的支持。这一新功能旨在使用生成式人工智能帮助用户更轻松地起草电子邮件,并目前仍处于实验室测试阶段。这一系列举措显示了谷歌在整合人工智能技术方面的持续努力。
比亚迪多款车型将迎OTA升级:新增小憩模式、智能语音快捷辅助等功能
比亚迪将针对秦PLUSDM-i、汉DM-i、汉Dm-p、宋ProDm-i车型推送了新一轮OTA升级。此次升级主要将对车辆的部分功能进行优化,并进行升级。该消息非比亚迪官方发布,最终实际的OTA升级情况还要以官方资料为准。