今日AI:GPT-4.5意外曝光可能6月发布、UP主借AI识别情绪播放量186万、全球首个AI程序员诞生
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
WhisperKit官网体验入口 iOS和macOS语音AI识别工具包下载地址
WhisperKit是一个基于Whisper项目的推理工具包,由Argmax公司推出。它允许在iOS和macOS应用程序中进行语音识别和转录。欲了解更多信息,请访问WhisperKit官方网站。
B站UP主借AI识别情绪玩法整活《亮剑》名场面播放量186万
B站UP主“佛辣西威”借助国产电视剧《亮剑》中的“有胜阅兵”视频片段,成功制作了一支引人注目的AI识别情绪视频。该视频在B站上的播放量已经达到186万,吸引了大量网友参与评论,形成了一场“梗上加梗”的热潮。值得一提的是,UP主“佛辣西威”此前已经成功制作了多个AI情绪识别的视频作品,包括今年2月爆火的AI情绪识别《上春山》。
Imagen A Texto官网体验入口 AI图像转换工具在线OCR识别
ImagenATexto是一个在线工具,可以将图像转换为可编辑的文本。它使用先进的OCR技术,确保准确提取图像中的文本。通过先进的OCR技术,ImagenATexto能够准确识别图像中的文字,并提供编辑功能。
谷歌开源Magika:AI驱动文件类型识别系统,提升用户安全
Google最近开源了一款名为Magika的文件类型识别系统,该系统由AI驱动,能够在毫秒级内准确识别超过100种不同的文件类型,包括二进制文件和文本文件。在Google内部,Magika被广泛应用于提升用户安全,主要用于对Gmail、Drive和安全浏览中的文件进行适当的安全检查和内容策略扫描。详细介绍和演示可以在其网站和GitHub页面上找到。
Magika官网体验入口 谷歌AI文件类型识别工具免费下载使用地址
Magika是一款由谷歌研发的快速准确的文件类型识别工具,基于深度学习模型,可以在毫秒级时间内识别二进制文件和文本文件类型。它的准确率明显高于其他现有工具,尤其在识别代码文件和配置文件时效果更佳。想了解更多Magika的信息,请访问其官网进行深入了解。
Bumble推出新AI工具可识别并阻止诈骗帐户、虚假个人资料
Bumble今天宣布推出一款新的人工智能功能,名为DeceptionDetector,旨在帮助识别垃圾邮件、诈骗和欺骗个人数据。这一创新工具将在用户发现恶意内容之前自动采取行动,有效提高用户在线安全体验。这一举措进一步强化了Bumble在体验和在线安全方面的领先地位,为用户提供更加可靠和真实的社交交流平台。
WhisperKit官网体验入口 AI自动语音识别模型压缩与优化工具在线使用地址
WhisperKit是一个专为自动语音识别模型压缩与优化设计的强大工具。它不仅支持对模型进行压缩和优化提供详细的性能评估数据。通过WhisperKit官网,您可以详细了解该工具的功能和应用,并体验其卓越的自动语音识别模型优化能力。
三星Galaxy AI发布了款AI手机Galaxy S24:支持语言理解、图像识别等AI多模态能力
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
轻松识别Midjourney等AI生成图片,开源GenImage
AIGC时代,人人都可以使用Midjourney、StableDiffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。华为团队认为,该领域未来值得努力的方向是不断提升检测器在GenImage数据集上的准确率,并进提升其在真实世界面对虚假信息的能力。
AI魔镜来了!BMind智能镜基于生成式AI可识别人类情绪
在CES2024上亮相的一款智能镜将童话中的短语“镜子镜子,告诉我,谁是最美的人”带入现实。Baracoda的BMind智能镜搭载生成式人工智能,宣称能够判断用户的情绪,并随之提供肯定的话语、图像等,以改善用户的心情。BMind智能镜将于2024年底上市,售价在500美元至1000美元之间。
英伟达推新AI语音识别模型Parakeet 号称优于Whisper
领先的开源对话AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列最先进的自动语音识别模型,能够以出色的准确性转录英语口语。ParakeetASR模型与Suno.ai合作开发,是语音识别领域的一大突破,为实现更自然高效的人机交互铺平了道路。要在本地访问模型并探索工具包,请访问NVIDIANeMo的Github页面。
AI识别出地震先兆信号?机器学习发现数据神秘关联,人类有望预测地震
【新智元导读】10年前,「地震预测」在圈内还是如尼斯湖水怪一般的奇谈怪论,但机器学习的发展,已经让「准确预测地震」的可能性,又往前迈进了一步。最近一段时间,世界各地地震频发。可以确定的是,AI确实让某些东西变得不一样了。
美国FTC禁止Rite Aid在店内使用人工智能面部识别技术
美国联邦贸易委员会周二表示,RiteAid被禁止使用人工智能面部识别来遏制入店行窃,为期五年。根据FTC的指控,该药品连锁公司未能在数百家店内使用面部识别技术时实施合理程序,防范对消费者的伤害。司法部宣布起诉RiteAid,指控其在阿片类药物流行期间填写数十万张“存在明显红旗”的受控物质处方。
Meta Ray-Ban智能眼镜引入AI,可识别物体和语言翻译
Meta公司最新宣布将在其Ray-Ban智能眼镜上推出引人注目的多模态AI功能,为用户提供更智能、交互式的体验。该功能利用眼镜的摄像头和麦克风,使Meta的AI助手能够感知用户周围的视听信息,并做出相应的反应。对于智能眼镜市场言,这一步或许将开创更为多元化的应用场景,为用户带来更加便捷和智能的生活体验。
Meta 推出雷朋智能眼镜的多模态 AI 功能测试:可识别物体并翻译语言
Meta宣布将开始推出其多模态AI功能的早期访问测试,这些功能将应用于MetaRay-Ban智能眼镜,能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。马克·扎克伯格在Instagram的一个视频中展示了这次更新,他询问眼镜建议哪种裤子与他手里拿着的衬衫相配。有关如何加入的说明可以在此处找到。
用活人脑细胞构建AI系统,语音识别准确率提升至78%
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。通过使用活人脑细胞构建AI系统,语音识别准确率得到提升,这一突破将为未来AI技术的发展带来重要启示。
知网推出AI生成文本检测新专利 提升论文代写识别效率
同方知网数字出版技术股份有限公司申请了名为“一种AI生成文本的检测方法、装置、介质及设备”的专利。该专利通过多种特征分析,可以自动判断一篇文本是否为AI生成,从检测代写论文等学术不端行为。这项专利有助于知网进一步提升代写论文检测的效率与质量,维护学术诚信。
Google 升级 Gmail 人工智能垃圾邮件过滤器:RETVec 现能有效识别并处理「对抗性文本操纵」
站长之家12月5日消息:Google在其安全博客上宣布,Gmail的垃圾邮件过滤功能经历了近年来最大规模的升级。这一升级主要体现在一种名为RETVec的新文本分类系统上。RETVec已在内部测试了一年时间,并已经部署到用户的Gmail账户中。
研究人员开发自动识别古代楔形文字片的AI软件
一项由马丁·路德大学哈勒-维滕贝格、约翰内斯·古腾堡大学迈因茨分校和迈因茨应用科学大学团队开发的新型人工智能软件如今能够解读难以辨认的楔形文字。与以往依赖照片的方法不同,该AI系统利用楔形文字片的3D模型,传递的结果比先前的方法更加可靠。该软件还可能有助于解读受损的铭文,例如在墓地中的三维楔形文字。