清华大学提出三维重建的新方法O²-Recon 支持大角度旋转和平移
清华大学团队提出了O²-Recon方法,利用2D扩散模型补全图像中被遮挡的物体,然后通过神经隐式表面场重建完整的三维物体。在现有方法的基础上,O²-Recon能够更准确地重建三维结构,并支持大角度的旋转和平移,具有广泛的应用前景。该方法的提出为物体级别的三维表面重建技术带来了新的突破,有望在AR/VR/MR以及机器人等领域得到广泛应用。
谷歌开发实时渲染大型三维场景技术SMERF
Google团队开发了一种名为SMERF的技术,可以在最大300平方米的房间内实时创建非常逼真的三维场景,其精度达到厘米级别。这项技术的最大特点是,它可以在普通智能手机和笔记本电脑上实现60fps或更高的速度实时渲染,并提供完整的六自由度3D导航体验。这项技术的出现将为用户带来更加真实、流畅的三维体验无需昂贵的设备,只需普通的智能手机和笔记本电脑即可。
首个三维具身通才智能体LEO:全面掌握感知、推理、规划、行动
多模态大语言模型在自然语言处理、视觉理解和机器人领域取得了显著进展。这些模型主要基于二维图片和文本数据,对于理解和交互于三维世界的任务存在一定的欠缺。LEO的出现标志着具身通才智能体在三维世界任务上取得了新的突破,为实现通用人工智能迈出了重要一步。
昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测
昆仑万维在2024年4月17日宣布「天工3.0」基座大模型和「天工SkyMusic」音乐大模型开始公测。「天工3.0」拥有4000亿参数,超越了3140亿参数的Grok-1,是全球最大的开源MoE大模型,在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域有突破性性能提升。昆仑万维不断推出前沿大模型产品,构建AI业务矩阵,包括AI搜索、AI音乐、AI视频等,成为国内AI科技企业中�
昆仑万维:天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放
「天工SkyMusic」是一款由昆仑万维开发的AI音乐生成大模型,通过该应用,用户可以享受独特的音乐创作体验。即使是零基础的用户也可以利用该应用将灵感转化为动听的歌曲。用户还可以进行二次编辑。
天工SkyMusic体验入口 昆仑万维AI音乐生成大模型免费邀测申请地址
天工SkyMusic是一款基于昆仑万维「天工3.0」超级大模型打造的AI音乐生成大模型。它支持高质量AI音乐生成、人声合成、歌词段落控制、多种音乐风格和音乐智能表达等功能。「天工SkyMusic」正式版也将在4月17日随「天工3.0」面向全社会免费开放。
昆仑万维AI音乐生成大模型「天工SkyMusic」启动邀测
4月2日,昆仑万维AI音乐生成大模型「天工SkyMusic」开始面向社会免费邀测,邀测将开放1000个免费名额,主要针对行业媒体、专家和音乐从业者。该大模型基于昆仑万维的「天工3.0」超级大模型,是目前国内唯一可用的AI音乐生成大模型。通过这些努力,昆仑万维希望构建一个更加智能、互联、理解和尊重每个人个性的世界。
高通推出第三代骁龙8s移动平台 支持100亿AI参数模型
高通技术公司震撼发布全新旗舰级移动平台——第三代骁龙®8s,为Android旗舰智能手机市场注入了全新活力。这款平台不仅继承了骁龙8系平台广受欢迎的特性,更在多个方面实现了显著升级,为用户带来前所未有的顶级移动体验。首款搭载该平台的终端预计将于3月正式面市,届时消费者将能够亲身体验到这款旗舰级移动平台带来的非凡魅力。
李彦宏:百度文心大模型推理成本已降至1%!与三星、荣耀等达成合作
在百度2023年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。李彦宏表示,自发布以来,百度不断降低文心大模型的推理成本,文心一言”3.5版本的推理成本是3.0版本的1%。我们也希望以此为契机打造以文心一言”为核心的生态系统,同时也希望越来越多的用户能够从中获益”,李彦宏表示。
Groq大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达
Groq公司推出的大模型推理芯片以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU。该芯片由初创公司Groq研发,其团队成员来自谷歌TPU,包括创始人兼CEOJonathanRoss,曾设计实现第一代TPU芯片的核心元件。Groq产品以其出色的推理性能、对多种开源LLM模型的支持以及具有竞争力的价格政策等特色,成为一个引人注目的选择。
昆仑万维发布「天工2.0」MoE大模型 新增多款 AI Agent
昆仑万维发布了新版MoE大语言模型「天工2.0」和新版「天工AI智能助手」APP。这是国内首个搭载MoE架构并免费向C端用户开放的大语言模型应用。昆仑万维是国内模型技术和工程能力最强、布局最全面的人工智能大模型企业之一。
三星和百度宣布合作 Galaxy S24系列集成文心大模型
三星电子和百度智能云宣布合作,将百度的文心大模型集成到三星全新的AI手机GalaxyS24系列中。GalaxyS24系列搭载了百度文心大模型的多项能力,包括通话、翻译、智能摘要、排版等功能。端侧AI还可以实时转录语音为文本,并区分不同发言人,支持多语种翻译和生成会议纪要,为用户提供更轻松自如的跨语言交流和办公体验。
首创“即圈即搜”!三星Galaxy S24系列接入百度文心大模型
今晚,三星GalaxyS24系列国行版正式发布,售价5499元起,该系列最大的亮点就是基于AI能力衍生出诸多AI应用。三星GalaxyS24系列接入百度文心大模型,不仅可提供端侧赋能的通话、翻译功能给带来全新智能摘要、排版等生成AI体验。在实时翻译时,用户可以选择对方语言,同时系统也能自动识别,用户还能关掉对方原声,只听自动翻译过后的合成语音。
三星S24手机搭载AI模型:AI大模型应用越来越广泛
手机厂商纷纷投入AI大模型的研发,标志着2018年进入快速发展阶段。预计到2027年,AI手机市场占比将达到45%,这一趋势源自智能手机行业对新技术的积极响应,尤其是生成式人工智能的迅猛发展。在实现实质性突破之前,除了提供个性化体验之外需要在实用性和易用性方面进行深入研究与改进。
AI视野:Adobe发布视频模型ActAnywhere;SVD将强势升级;新壹视频大模型通过备案;三星Galaxy AI两年内将开启付费
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5
对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型AI的一个光明的方向。在对话型人工智能研究中,存在趋势即朝着开发参数更多的模型方向发展,如ChatGPT等为代表的模型。混合模型通过协作多个较小的对话型人工智能,在提供比单个更大的对话型人工智能更高质量的对话方面是有效的。
努比亚Z60 Ultra搭载全焦段三主摄:配备业界首个影像AI大模型
努比亚今日下午举行了新品发布会,为大家带来了努比亚Z60Ultr期间新机。努比亚Z60Ultra采用全焦段高定光学三主摄,包括35mm人文之眼、85mm人像镜皇、还有重磅升级的18mm广角。尤其是在努比亚强项的星空、人文等多方面,因此能更好对AI技术进行深度融合,并更好地进行定制化专属影像场景训练,以此打造出的业界首个垂直影像AI,能让努比亚的影像系统进化得更强大。
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。对于BSChecker来说,引入一个关于有益性的评估标准可能很重要。
三星即将推出的 Galaxy Book 4 系列规格泄露,可能搭载英特尔 AI 芯片以运行「Samsung Guass」专有 AI 模型
三星正准备在年底前揭晓其全新Windows笔记本电脑阵容。GalaxyBook4系列的规格和产品图片已经几乎完全曝光。在WindowsSoC中集成强大的NPU有潜力改变用户在便携式Windows机器上的工作方式。