Leonardo Ai推新功能Transparency 一键生成高质量透明PNG图像
LeonardoAi发布了一项创新的功能——Transparency。这项功能能够生成真正的本地透明PNG图像。我们期待这一功能在未来能够带来更多的可能性,满足更多用户的需求。
传音新机Spark 20 Pro在海外市场推出 后置摄像头仅“虚标”
传音在海外市场推出了Spark20Pro手机,该款手机搭载联发科HelioG99处理器和108MP主摄摄像头,售价约为716.09人民币。根据GSMArena数据库显示,这款手机的后置摄像头实际上只有“双摄”,其中一个仅起到装饰作用。系统预装了Android13操作系统。
视频版ContorlNet来了!SparseCtrl增强AI生成视频可控性
在文本到视频领域的最新研究中,SparseCtrl技术通过引入时间稀疏信号实现了对视频结构的灵活控制。传统的文本提示在空间不确定性方面存在问题,容易导致模糊的帧组合。我们可以期待看到SparseCtrl在各种领域的广泛应用,为视频生成领域带来更多的创新和可能性。
谷歌推具备空间推理能力的视觉语言模型SpatialVLM
谷歌最新研究提出SpatialVLM,旨在解决视觉语言模型缺乏空间推理能力的问题。视觉语言模型在理解目标在三维空间中位置或关系时存在困难,研究者通过借鉴人类空间推理能力的思路,提出了这一新方法。这一研究成果有望推动视觉语言模型在未来的发展方向上取得更大突破,为人工智能领域带来新的进步。
谷歌提出最新模型SpatialVLM :赋予视觉语言模型空间推理能力
谷歌最新论文揭示的SpatialVLM,是一种具备空间推理能力的视觉语言模型,旨在解决当前视觉语言模型在空间推理方面的困难。视觉语言模型在图像描述、视觉问答等任务上取得显著进展,但在理解目标在三维空间中的位置或空间关系方面仍存在难题。这一研究为视觉语言模型的空间推理能力提供了新的思路,为未来在机器人、图像识别等领域的发展带来了新的可能性。
谷歌AI研究提出 SpatialVLM:一种数据合成和预训练机制,以增强视觉语言模型 VLM 空间推理能力
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型空间推理能力的创新系统。尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。-SpatialVLM的开发标志着人工智能技术的重大进步。
SpaceX发布新一代Starlink终端 结构优化视野提升网络增强
科技公司SpaceX最近悄然为其星链卫星互联网服务推出了一款新的标准终端。与早期型号相比,新终端在外形和功能上都有显著优化。随着产能提升,这款终端有望在未来几个月内面向更多用户开放和推广。
GitHub发布编程字体家族Monaspace 支持混合使用5款等宽字体
代码托管平台GitHub发布了一套名为Monaspace的开源编程字体家族。这套字体家族包含5种字体,分别是Neon、Argon、Krypton、Xenon和Radon。希望通过这款字体家族为编程工作带来更多乐趣。
GitHub发布Copilot Workspace 开发者第二大脑来袭
CopilotWorkspace是GitHub新发布的开发工具,旨在帮助开发者完成更大、更复杂的任务。该工具侧重于任务选择、意图表达和与AI合作寻求解决方案,同时GitHub结合AI智能体技术和GitHubCodespaces实现无头、短暂、安全的计算方式。CopilotWorkspace成为了开发者的「第二个大脑」,为他们提供了强大的工具和功能,极大地提高了开发效率和完成任务的质量。
小米:已捐献“UltraSpace 存储扩容” 相信友商会跟进
小米14正式发布,除了常规硬件升级外,雷军还宣布了一项重磅功能,即澎湃OS配合存储实现的存储扩容。小米将原本256GB的存储容量提升到了264GB原本512GB的存储容量更是提升到了528GB。小米已经将这个技术标准贡献给了UFS协会组织,这意味着不久的将来,各大手机厂商应该都会适配这个功能。
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。谷歌研究人员表示,ScreenAI模型还需要在一些任务上进行更多研究,以缩小与GPT-4和Gemini等更大模型的差距。
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
就在Sora疯狂刷屏那天有两款重磅产品发布:一个是谷歌的Gemini1.5,首个支持100万tokens上下文的大模型;另外一个便是全球科技、社交巨头Meta的V-JEPA。在功能方面V-JEPA与Sora有很多相似之处,例如,都具备让AI学会如何通过自我监督学习认识、模拟世界,以提升生成视频的质量、表示学习方法和扩大视频训练数据范围。但Meta表示,下一步,将会把V-JEPA与音频相结合使用,并且可以充
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Meta首发AI视频模型V-JEPA 可用人类的理解方式看世界
深度学习领域泰斗LeCun在WGS峰会上怒斥Sora模型不能真正理解物理世界,引起广泛关注。仅根据文字提示生成逼真的视频,并不代表模型理解了物理世界,与基于世界模型的因果预测有本质区别。V-JEPA的发布不仅是对Sora的回击,更展示了Meta公司在AI领域的先进技术,为实现具身AI技术和未来增强现实眼镜提供了有力支持。
LeCun怒斥Sora不能理解物理世界!Meta首发AI视频「世界模型」V-JEPA
【新智元导读】短短几天,「世界模型」雏形相继诞生,AGI真的离我们不远了?Sora之后,LeCun首发AI视频预测架构V-JEPA,能够以人类的理解方式看世界。Sora一经面世,瞬间成为顶流,话题热度只增不减。它仍然是插值潜在空间的嵌入,到目前为止你还不能以这种方式构建「世界模型」。
FF完成近1600项OTA功能升级 AI助理FF aiPal功能进一步优化
FF今日宣布,FF912.0自去年开始交付以来,完成了首次大版本远程升级。此次升级包括752项新增功能与846项功能优化。此次升级还包括对人工智能助理FFaiPal功能的进一步优化和改进。
Aiartapps官网体验入口 AI艺术图像创作工具免费试用地址
Aiartapps是一款为设计师和创意工程师提供各种AI艺术相关的资源和工具的创新产品。它为用户提供了生成艺术、人物头像创作、儿童故事生成、图像创作等多种功能无需具备机器学习知识。立即访问官网,体验创作的乐趣!
苹果在日本上线龙年活动:买iPhone送龙年AirTag
今天,苹果在日本官网正式上线了2024龙年活动,1月2日到5日期间,购买符合条件的iPhone手机,即可获赠龙年图案AirTag追踪器。具体活动内容为:凡购买指定苹果产品,即可免费获得价值最高3万日元的苹果礼品卡。值得一提的是,日本并不是农历新年是从2024年元旦开始就是龙年,与中国过了农历新年才是龙年有所不同。
贾跃亭旗下法拉第未来宣布推出AI产品FF aiPal Beta
法拉第未来推出生成式AI产品aiPalBeta,号称“极致贴心”。这是一款出行领域的生成式AI产品,利用大语言模型,可以为用户提供个性化的AI体验。该产品将首先向“共创官”提供测试版本,用户可以通过官网上的“FFLabs”申请测试体验。
贾跃亭旗下FF推出AI产品「FF aiPal Beta」 可提供生活服务
贾跃亭旗下法拉第未来发文称,作为行业先驱和第一家集成ChatGPT技术的汽车制造商,FF推出了另一项革命性产品:FFaiPalBeta,这是出行领域的GenerativeAI产品,利用大语言模型的先进技术,提供令人耳目一新的个性化人工智能体验。FFaiPal为用户创造了极致贴心个性化AI体验,在屏幕侧边栏根据实时地理位置为用户提示周边的生活服务,例如推荐附近米其林餐厅等。当用户开车前往�