阿里开源视频自动化剪辑工具FunClip 支持中文语音识别
阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具,专为精准和便捷的视频切片设计。FunClip能够自动识别视频中的中文语音,并允许用户根据语音内容裁剪视频,大大提高了视频编辑的效率。阿里巴巴通过这些开源项目,展示了其在AI技术领域的领导地位和对开放创新的承诺。
AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
AssemblyAI最新研究成果展示了他们的Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。Universal-1比WhisperLarge-v3更准确,比fastWhisper更快,38秒可以处理60分钟音频。值得一提的是,非开源,仅提供API调用。
WhisperKit官网体验入口 AI自动语音识别模型压缩与优化工具在线使用地址
WhisperKit是一个专为自动语音识别模型压缩与优化设计的强大工具。它不仅支持对模型进行压缩和优化提供详细的性能评估数据。通过WhisperKit官网,您可以详细了解该工具的功能和应用,并体验其卓越的自动语音识别模型优化能力。
英伟达推新AI语音识别模型Parakeet 号称优于Whisper
领先的开源对话AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列最先进的自动语音识别模型,能够以出色的准确性转录英语口语。ParakeetASR模型与Suno.ai合作开发,是语音识别领域的一大突破,为实现更自然高效的人机交互铺平了道路。要在本地访问模型并探索工具包,请访问NVIDIANeMo的Github页面。
腾讯云推出语音识别系统ASR 语音识别大模型上线
腾讯云ASR是腾讯云推出的语音识别系统。最新升级后,腾讯云ASR能够更好地处理方言和噪声,提高识别准确率和理解能力。产品的单日调用量达到了百亿次,服务的内外部企业客户数达到了数千个。
用活人脑细胞构建AI系统,语音识别准确率提升至78%
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。通过使用活人脑细胞构建AI系统,语音识别准确率得到提升,这一突破将为未来AI技术的发展带来重要启示。
美国FTC禁止Rite Aid在店内使用人工智能面部识别技术
美国联邦贸易委员会周二表示,RiteAid被禁止使用人工智能面部识别来遏制入店行窃,为期五年。根据FTC的指控,该药品连锁公司未能在数百家店内使用面部识别技术时实施合理程序,防范对消费者的伤害。司法部宣布起诉RiteAid,指控其在阿片类药物流行期间填写数十万张“存在明显红旗”的受控物质处方。