Nothing Phone 2即将亮相!新机内部代号为“PacManPro”
Nothing计划推出改良版Phone,内部开发代号为“PacManPro”。这款新手机预计会在设计、处理器以及其他方面进行调整。这让人不禁猜测,Nothing会不会在接下来的日子里带来更多令人惊喜的产品。
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。谷歌研究人员表示,ScreenAI模型还需要在一些任务上进行更多研究,以缩小与GPT-4和Gemini等更大模型的差距。
FF完成近1600项OTA功能升级 AI助理FF aiPal功能进一步优化
FF今日宣布,FF912.0自去年开始交付以来,完成了首次大版本远程升级。此次升级包括752项新增功能与846项功能优化。此次升级还包括对人工智能助理FFaiPal功能的进一步优化和改进。
Parrot提出新型多重奖励强化学习框架以改进文本生成图像
在使用强化学习进行文本生成图像时,质量奖励成为一个紧迫问题。尽管观察到通过强化学习RL可能提高图像质量,但多个奖励的聚合可能导致在某些度量中过度优化在其他度量中降级。但在Parrot潜在生成不当内容的能力方面引发了伦理关切,强调了在部署中进行审查和伦理考虑的必要性。
在线图像编辑器miniPaint 开源Photoshop网页最强替代品
miniPaint是一款令人印象深刻的在线图像编辑器,利用HTML5技术,用户无需购买、下载、或安装任何软件,也无需担心Flash的陈旧。其主要特点是直接在浏览器中运行,支持创建、编辑图像,并提供了多种方式导入图片,包括从剪贴板粘贴或从计算机上传。miniPaint是一款功能强大、操作简便、兼容性好的在线图像编辑工具,为用户提供了丰富的编辑和特效选择,成为浏览器中的Photoshop替代品。
GitHub发布Copilot Workspace 开发者第二大脑来袭
CopilotWorkspace是GitHub新发布的开发工具,旨在帮助开发者完成更大、更复杂的任务。该工具侧重于任务选择、意图表达和与AI合作寻求解决方案,同时GitHub结合AI智能体技术和GitHubCodespaces实现无头、短暂、安全的计算方式。CopilotWorkspace成为了开发者的「第二个大脑」,为他们提供了强大的工具和功能,极大地提高了开发效率和完成任务的质量。
1/10体量达到SOTA!谷歌发布5B参数视觉语言模型PaLI-3,更小更快却更强
堪称改变游戏规则的视觉语言模型PaLI-3问世,引得大量科研人员关注。PaLI-3是谷歌最新推出的视觉语言模型,以更小的体量,更快的推理速度,达到了更强的性能。PaLI-3还未完全开源,但是开发人员已经发布了多语言和英文SigLIPBase、Large和So400M模型。
谷歌发布PaLI-3视觉语言模型 小体量达到SOTA!
谷歌最新发布的PaLI-3视觉语言模型在小体量下实现了SOTA性能,引起广泛关注。这款模型以更小的体量和更快的推理速度实现更强大的性能,是谷歌去年推出的多模态大模型PaLI的升级版。这一创新有望影响视觉语言模型的未来发展方向,提供更高效的解决方案。
更流畅安全!华为MatePad 2023、MatePad Pro 12.6 2022升级鸿蒙OS 4.2
今日,华为发布升级公告,华为MatePad2023、华为MatePadPro12.6英寸2022两款平板开启鸿蒙HarmonyOS4.2公测。新版本为用户提供更简单易用的功能、更丝滑流畅的操作、更纯净安全的系统。在升级前将所有重要数据备份至PC或云端,特别是QQ、微信、第三方软件单独迁移备份,并确认备份内容完整有效,否则可能存在数据丢失风险。
谷歌推出3款免费 AI 图像编辑工具,Magic Editor、Photo Unblur 和 Magic Eraser
2023年10月4日,谷歌宣布将从5月15日起向所有谷歌相册用户免费提供三款生成式AI图像编辑工具:MagicEditor、PhotoUnblur和MagicEraser。MagicEditor能够轻松实现一键PS、调色和光影效果,让用户更加便捷地编辑图片。这也意味着用户无需再局限于专业的图片编辑软件,通过谷歌的AI工具,即可轻松实现多样化的编辑需求。
华为史上最大平板!华为MatePad Pro 13.2 SIM卡版开售:7499元
今日从华为官方商城了解到,华为MatePadPro13.212GB512GB新增SIM卡版本,首发到手价7499元。相比首发价5699元的12GB512GB版,SIM卡版本贵了1800元。核心参数上,华为MatePadPro13.2搭载Mate60系列同款的麒麟9000s芯片,内置10100mAh电池,支持88W快充。
系统更纯净 华为鸿蒙OS 4新体验版招募:支持MatePad 2023等4款平板
据花粉俱乐部介绍,今日,华为HarmonyOS4新体验版开启第二批花粉Beta招募。此次尝鲜升级支持华为MatePad2023、华为MatePad11英寸2023、华为MatePadAir、华为MatePadPro12.6英寸2023四款机型。增加病毒和风险应用的防误报机制,智能识别病毒与风险应用等。
AI图像编辑器Photoroom以5亿美元估值融资了4300万美元
Photoroom是一款来自巴黎的基于人工智能的照片编辑应用程序,它像杂草一样生长,目标是在线做生意的人,同时也吸引了大量休闲用户。该应用程序确认已完成最新一轮融资:4300万美元,最新一轮融资估值达到5亿美元。其他尚未公布,但之前的支持者包括KimaVentures、FJLabs、Meta以及一些天使投资人,例如YannLeCun、ZehanWang、HuggingFace和Disney的等等。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。尽管对比基线已经在K400上取得了有竞争力的结果,但所提出的全局蒸馏和token洗牌进一步提高了准确性。
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
就在Sora疯狂刷屏那天有两款重磅产品发布:一个是谷歌的Gemini1.5,首个支持100万tokens上下文的大模型;另外一个便是全球科技、社交巨头Meta的V-JEPA。在功能方面V-JEPA与Sora有很多相似之处,例如,都具备让AI学会如何通过自我监督学习认识、模拟世界,以提升生成视频的质量、表示学习方法和扩大视频训练数据范围。但Meta表示,下一步,将会把V-JEPA与音频相结合使用,并且可以充
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Meta首发AI视频模型V-JEPA 可用人类的理解方式看世界
深度学习领域泰斗LeCun在WGS峰会上怒斥Sora模型不能真正理解物理世界,引起广泛关注。仅根据文字提示生成逼真的视频,并不代表模型理解了物理世界,与基于世界模型的因果预测有本质区别。V-JEPA的发布不仅是对Sora的回击,更展示了Meta公司在AI领域的先进技术,为实现具身AI技术和未来增强现实眼镜提供了有力支持。
LeCun怒斥Sora不能理解物理世界!Meta首发AI视频「世界模型」V-JEPA
【新智元导读】短短几天,「世界模型」雏形相继诞生,AGI真的离我们不远了?Sora之后,LeCun首发AI视频预测架构V-JEPA,能够以人类的理解方式看世界。Sora一经面世,瞬间成为顶流,话题热度只增不减。它仍然是插值潜在空间的嵌入,到目前为止你还不能以这种方式构建「世界模型」。
InstantID模型发布 相比PhotoMaker保留了良好的文本可编辑性
人脸身份保持项目InstantID正式发布模型。与PhotoMaker和IP-Adapter-FaceID相比,InstantID实现了更好的保真度并保留了良好的文本可编辑性。InstantID还支持多重参考,允许使用多张参考图像来生成一个新图像,从增强生成图像的丰富性和多样性。
PhotoRoom势头强劲 完成融资将开启AI图像编辑新篇章
法国巴黎的初创公司PhotoRoom,专注于构建基于人工智能的图像编辑应用程序和API,近日完成一轮融资,消息人士透露融资规模在5000万至6000万美元之间,估值达到5亿至6亿美元。消息人士表示,曾领投PhotoRoom上一轮融资的Balderton也是这次融资的主要投资者之一,其他先前的支持者也参与其中。PhotoRoom继续通过视觉模型和自有数据进行平台构建和训练,以确保对图像更好的控制和�