苹果iPhone 16系列将配备升级麦克风 语音输入能力将大幅提升
苹果的iPhone16系列手机将会配备升级版的麦克风。这些改进将显著提高设备对用户声音的敏感度和识别率,从实现更加清晰流畅的语音输入。对于iPhone16系列手机来说,这些改进将带来更好的音频性能和用户体验。
微信输入法1.2.2正式版iOS/安卓双更新!剪贴板、方言语音输入来了
日前,微信输入法iOS、Android双端迎来1.2.2正式版升级,带来春节彩蛋”和多项新功能。升级日志显示,微信输入法iOS1.2.2正式版新增微信发过年好”后可放鞭炮、支持剪贴板和选词粘贴功能、语音输入支持直接说方言。该功能基于互联网,不要求设备在同一个局域网内是比较方便的。
谷歌Gmail新功能“Help Me Write”将很快支持语音输入
谷歌的人工智能辅助电子邮件起草功能“HelpMeWrite”即将迎来语音输入的支持。这一新功能旨在使用生成式人工智能帮助用户更轻松地起草电子邮件,并目前仍处于实验室测试阶段。这一系列举措显示了谷歌在整合人工智能技术方面的持续努力。
AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
AssemblyAI最新研究成果展示了他们的Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。Universal-1比WhisperLarge-v3更准确,比fastWhisper更快,38秒可以处理60分钟音频。值得一提的是,非开源,仅提供API调用。
WhisperKit官网体验入口 iOS和macOS语音AI识别工具包下载地址
WhisperKit是一个基于Whisper项目的推理工具包,由Argmax公司推出。它允许在iOS和macOS应用程序中进行语音识别和转录。欲了解更多信息,请访问WhisperKit官方网站。
WhisperKit官网体验入口 AI自动语音识别模型压缩与优化工具在线使用地址
WhisperKit是一个专为自动语音识别模型压缩与优化设计的强大工具。它不仅支持对模型进行压缩和优化提供详细的性能评估数据。通过WhisperKit官网,您可以详细了解该工具的功能和应用,并体验其卓越的自动语音识别模型优化能力。
英伟达推新AI语音识别模型Parakeet 号称优于Whisper
领先的开源对话AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列最先进的自动语音识别模型,能够以出色的准确性转录英语口语。ParakeetASR模型与Suno.ai合作开发,是语音识别领域的一大突破,为实现更自然高效的人机交互铺平了道路。要在本地访问模型并探索工具包,请访问NVIDIANeMo的Github页面。
腾讯云推出语音识别系统ASR 语音识别大模型上线
腾讯云ASR是腾讯云推出的语音识别系统。最新升级后,腾讯云ASR能够更好地处理方言和噪声,提高识别准确率和理解能力。产品的单日调用量达到了百亿次,服务的内外部企业客户数达到了数千个。
用活人脑细胞构建AI系统,语音识别准确率提升至78%
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。通过使用活人脑细胞构建AI系统,语音识别准确率得到提升,这一突破将为未来AI技术的发展带来重要启示。
Hugging Face研究人员推语音识别模型Distil-Whisper 速度提高、参数减少
HuggingFace研究人员最近解决了在资源受限环境中部署大型预训练语音识别模型的问题。他们通过创建一个庞大的开源数据集,使用伪标记的方法,提炼出了Whisper模型的较小版本,称为Distil-Whisper。尽管WER稍高,但distil-medium.en模型提供了更直接的推理和实质性的模型压缩。