一图看懂荣耀自研系统MagicOS 8.0:行业首发意图识别人机交互
今天下午,荣耀正式发布自研操作系统MagicOS8.0,行业首发新一代人机交互平台级AI使能的意图识别人机交互。基于MagicLive平台级AI的场景感知、意图决策、用户理解能力,荣耀MagicOS8.0的IUI支持自然语言、语音、图片、手势、眼动等多模态的交互方式。此外应用程序生命周期管理体系更进一步,反骚扰雷达再升级,可精准拦截摇一摇”广告。
荣耀MagicOS 8.0行业首次实现意图识别人机交互:操作比人快10倍
今天荣耀MagicOS8.0发布会召开,新一代荣耀MagicOS8.0正式发布。自2016年首次定义MagicLive智慧系统,到2022年发布以人为中心的平台级AI,荣耀坚持长期AI投资,AI技术快速演进也孕育着新的人机交互革命。传统人机操作可能需要10秒8步操作的事儿,如今荣耀MagicOS8.0只需要1秒1步操作就能完成。
大模型都会标注图像了,简单对话即可!来自清华&NUS
多模态大模型集成了检测分割模块后,抠图变得更简单了!只需用自然语言描述需求,模型就能分分钟标注出要寻找的物体,并做出文字解释。在其背后提供支持的,是新加坡国立大学NExT实验室与清华刘知远团队一同打造的全新多模态大模型。NExT-Chat通过在充沛的检测框数据训练基本的位置建模能力,之后可以快速的扩展到难度更大且标注更稀缺的分割任务上。
拿到全球千万下载后,AI图片App如何对抗“一波流体质”?| 对话创始人
data.ai借着ChatGPT上线一周年发布了一个榜单,罗列了自ChatGPT移动版本发布以来,全球下载量最高的10款AIGC应用。大多是和ChatGPT一样的聊天机器人,只有3款App被归类为AI艺术生成器,也就是我们熟知的AI生图App。AI技术创新为那些有能力的创业团队提供了一个切入早已山头林立的“旧赛道”的机会他们的探索也许将在2024年,结出不一样的果实。
数字地图公司TomTom与微软合作开发基于人工智能的车载对话助手
数字地图专家TomTom周二表示,该公司与科技巨头微软合作,共同开发了一款基于人工智能的车载对话助手。该助手可以让用户与车辆进行自然对话,并实现与信息娱乐、位置搜索和车辆控制系统的语音交互。该公司自2016年开始与微软合作,当时它开始为AzureMaps位置服务提供动力。
Krea官网体验入口 AI创意图像软件app免费下载地址
KREA是一种革新的创意工具,它利用人工智能技术生成高质量的视觉效果。这款工具能够理解用户的风格、概念或产品需求,并通过上传图片来训练AI引擎,在画布上生成图像。以上就是「KREA」的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验!
杀敌一千自损八百:韩国有人意图网购臭虫报复邻居
最早在法国巴黎泛滥的臭虫已经蔓延到世界多个国家和地区,亚洲国家里,韩国目前较为严重,已经呈现快速发展的迹象。让人没想到的是,竟然还有人网购臭虫试图报复自己的邻居,这种行为也被网友戏称为杀敌一千,自损百八”。其以吸血为生,主要是人血,比蚊子吸得多得多,但也会吸食其他温血动物的血,例如猫狗和家禽,可传播多种疾病,臭名远扬。
抖音旗下剪映测试“Dreamina”AIGC工具 可用于生成创意图片
近日,抖音旗下的剪映应用正在测试一个名为“Dreamina”的AIGC工具,该工具属于文生图的创作领域。通过这个工具,用户可以根据一段文字生成四幅由AI生成的创意图,生成的图片可以保存下来,也可以重新生成。这个工具未来可能会用于抖音的图文或短视频的内容创作,以丰富抖音在AI创造方面的内容库。
T-Rex2:文字来描述、框选就能识别图片中的目标物体
DeepDataSpace推出了T-Rex2,一种革新性的目标检测技术,旨在解决传统目标检测模型的封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。通过Demo和API,用户可以体验T-Rex2的能力,并探索其在各领域的潜在应用。
Imagen A Texto官网体验入口 AI图像转换工具在线OCR识别
ImagenATexto是一个在线工具,可以将图像转换为可编辑的文本。它使用先进的OCR技术,确保准确提取图像中的文本。通过先进的OCR技术,ImagenATexto能够准确识别图像中的文字,并提供编辑功能。
谷歌发布时间感知框架MUSCATEL:图像识别准确率提升15%
谷歌AI团队最近发布了一项名为MUSCATEL的全新时间感知框架,旨在对抗概念漂移问题,提升图像识别准确率。概念漂移一直是机器学习领域的难题,即数据分布随时间变化,影响模型持续有效性。谷歌发布的MUSCATEL方法为机器学习领域的概念漂移问题提供了一种创新的解决方案,为模型在大规模、动态数据集中持续准确地进行分类提供了新的思路和方法。
Anthropic计划为Claude增加图像识别能力
Anthropic公司近期宣布计划为其聊天机器人Claude增加图像识别功能,从使其具备分析图像的能力。Anthropic的开发团队正在致力于赋予Claude分析图像的能力,这是Claude相对于竞争对手ChatGPT和Bard所缺乏的特性之一。随着人工智能技术的不断发展,我们可以期待更多类似的创新,推动整个行业不断向前发展。
三星Galaxy AI发布了款AI手机Galaxy S24:支持语言理解、图像识别等AI多模态能力
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
轻松识别Midjourney等AI生成图片,开源GenImage
AIGC时代,人人都可以使用Midjourney、StableDiffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。华为团队认为,该领域未来值得努力的方向是不断提升检测器在GenImage数据集上的准确率,并进提升其在真实世界面对虚假信息的能力。
视觉编码器VCoder:提高模型在识别图像方面的能力
VCoder是一个视觉编码器,旨在提高多模态语言模型在识别图像中的对象和理解图像场景方面的能力。它能够帮助模型更好地理解和分析图像内容。在与其他模型的比较中,VCoder在对象计数和识别方面表现出色,特别是在复杂场景中。
支付宝小程序云上线“云AI” 支持文字、图片、情绪的智能识别
支付宝小程序云服务又升级了,全新推出文字识别、智能视觉和自然语言处理等3项智能应用功能,让小程序服务商和开发者通过开箱即用的云AI产品,实现全面、便捷、高效的人工智能服务,提高服务效率和用户体验,降低人工成本。针对小程序信息交互场景下,文字手动输入麻烦、图片信息真伪难辨、文本信息分析难度大等痛点,支付宝小程序云在此次升级中上线了「文字�
OpenAI正开发新AI检测工具 识别AI生成图像准确度高达99%
OpenAI最近宣布正在研发一种工具,旨在高度准确地检测由人工智能生成的图像。该工具的可靠性高达99%,由OpenAI的首席技术官MiraMurati确认。这一消息引发了业界的关注,展示了OpenAI在人工智能领域的持续创新。