Meta 推出雷朋智能眼镜的多模态 AI 功能测试:可识别物体并翻译语言
Meta宣布将开始推出其多模态AI功能的早期访问测试,这些功能将应用于MetaRay-Ban智能眼镜,能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。马克·扎克伯格在Instagram的一个视频中展示了这次更新,他询问眼镜建议哪种裤子与他手里拿着的衬衫相配。有关如何加入的说明可以在此处找到。
谷歌开源Magika:AI驱动文件类型识别系统,提升用户安全
Google最近开源了一款名为Magika的文件类型识别系统,该系统由AI驱动,能够在毫秒级内准确识别超过100种不同的文件类型,包括二进制文件和文本文件。在Google内部,Magika被广泛应用于提升用户安全,主要用于对Gmail、Drive和安全浏览中的文件进行适当的安全检查和内容策略扫描。详细介绍和演示可以在其网站和GitHub页面上找到。
腾讯云推出语音识别系统ASR 语音识别大模型上线
腾讯云ASR是腾讯云推出的语音识别系统。最新升级后,腾讯云ASR能够更好地处理方言和噪声,提高识别准确率和理解能力。产品的单日调用量达到了百亿次,服务的内外部企业客户数达到了数千个。