Tanuki通过自动模型蒸馏 轻松构建LLM技术驱动的应用
Tanuki.py是一个用于构建LLM驱动应用的工具库。该库旨在通过自动模型蒸馏,实现应用在使用过程中的成本和延迟的逐渐降低,最多可达到90%的成本降低和80%的延迟降低。其类型感知、RAG支持和测试驱动的对齐方法使其成为构建可靠、可预测、逐渐优化的LLM-powered应用的理想选择。
腾讯手机QQ 9版本正式上线 采用QQNT技术架构驱动
腾讯宣布QQ9正式焕新上线。QQ9是一款全新版本的QQ,采用了全新的QQNT技术架构驱动,使性能得到升级,交互体验更加流畅。QQ9新增了多群管理功能,方便管理多个QQ群,群互动概况一目了然,群文件支持在线预览,减轻内存压力。
Spotify 裁员以加快进军人工智能领域:用 AI 技术提升用户体验并驱动增长
音乐流媒体巨头Spotify上周宣布,将裁员约17%,以在经济增长「大幅」放缓的情况下削减成本。该公司表示,大约1,500人将离开公司。运行用于理解所有播客/有声书的大型语言模型是资源密集型的,可能会带来额外的数据隐私和成本挑战。
细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了MaskedTransformer和ResidualTransformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
穆迪推出由 Google Cloud 驱动的生成式 AI 新技术:旨在加速数据分析与报告编写流程
Moody’s正在推出一项新技术,该技术由生成式人工智能支持,旨在帮助员工在分析大量数据和编写报告的过程中节省时间。图源备注:图片由AI生成,图片授权服务商Midjourney该公司为员工提供了来自GoogleCloud的大型语言模型,以快速筛选公开文档和公司自有的信息数据库,以帮助他们编写分析报告。」另外,今年六月,微软宣布与穆迪达成战略合作,将基于AzureOpenAI服务的Moody�
Captury创新3D体积扫描技术 实现真实动态捕捉
Captury公司近日推出了一项革命性的3D体积扫描技术,通过高分辨率摄像头实时捕捉纹理和网格数据,能够创建人物或物体的真实3D模型,无论是静止还是运动中的状态。这项技术的推出,无疑将对3D建模、动画制作、游戏开发等领域产生深远影响。这一技术的推出,将为3D建模、动画制作、游戏开发等领域带来新的可能。
Beeble AI与纽约大学合作 发布创新的人像重照明技术SwitchLight
BeebleAI与纽约大学联手发布了一项新的研究成果,一种创新的人像重照明技术。这项技术能够在非常低的成本下,将人物与虚拟环境的光照完美融合,效果令人印象深刻。BeebleAI和纽约大学的合作,为我们带来了一种新的人像重照明技术,这种技术不仅成本低廉效果出色,为未来的图像处理和虚拟现实技术开辟了新的可能性。
小米首款竖折旗舰!小米MIX Flip搭载国产屏:创新零感折痕技术
据数码闲聊站最新爆料,小米MIXFlip竖屏小折叠会采用国产屏幕,同时配备零感折痕技术。目前这个技术还没有更多信息揭晓,但推测应该是从屏幕材质和铰链等多方面优化,比如铰链设计多层结构,在展开之后托住屏幕,让折痕处更加平整。因为MIXFold3起售价8999元,小折叠一般价格更低,或许会在5999元左右,值得期待。
科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型
科学家们在世界上最强大的超级计算机上取得了巨大突破,仅使用其8%的计算能力,成功训练了一个与ChatGPT规模相当的模型。这项研究来自著名的OakRidgeNationalLaboratory,他们在Frontier超级计算机上采用了创新技术,仅使用数千个AMDGPU就训练出了一个拥有万亿参数的语言模型。这项研究为未来训练巨大语言模型提供了宝贵的经验和方法,同时也突显了分布式训练和并行计算在实现这一目标上的关键作用。
国家广播电视总局:华为获批设立“超高清技术创新与应用重点实验室”
今天国家广播电视总局发布批复称,同意在华为技术有限公司设立超高清技术创新与应用国家广播电视总局重点实验室”。批复中表示,超高清技术创新与应用国家广播电视总局重点实验室”要围绕超高清产业链,在内容生产、传输分发、终端呈现等领域,开展全链条的关键性基础性技术创新和应用示范。在今年的第三十届北京国际广播电影电视展览会期间,华为展还示了领�
2023 年最重要的 3 项人工智能创新:多模态 AI、宪法 AI 和文本转视频技术
2023年,人工智能领域见证了重大进展,不仅公众对AI有了更深的理解,政府也开始认真对待AI风险。本年度的发展不仅是新技术和理念的出现,更是长期孕育后的集中爆发。这些免费工具试图改变用户生成内容的格局,可能在2024年发生,但由于文本转视频工具计算成本高,一旦风险资本用尽,它们可能开始收费。
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。
阿里推创新视频生成技术Animate Anyone 一张图片即可生成平滑稳定视频
阿里推出了一项名为AnimateAnyone的研究,该研究通过引入扩散模型,克服当前图像到视频合成中的一些挑战,特别是在角色动画领域。论文提出了一种全新的框架,通过巧妙设计的ReferenceNet、姿势引导器和时间建模方法,解决了维持细节一致性和运动连贯性的问题。带来的技术突破和实证结果表明,这一方法在角色动画领域具有巨大的潜力,为数字媒体和创意产业注入了新的活�
联发科董事长蔡明介荣膺IEEE至高荣誉:天玑平台全面布局技术创新
最近,联发科董事长蔡明介先生荣获了全球最大非营利性专业技术学会IEEE颁发的罗伯特N诺伊斯奖。这是IEEE颁发给个人的至高荣誉之一,旨在表彰蔡明介凭借其远见以及对全球半导体产业的影响力,和联发科一起为全球数十亿用户带来先进的科技体验?。无疑都离不开灵魂人物蔡明介的远见卓识和杰出领导。
宝星环球APP:创新驱动下的改革,12年稳健运营引领行业潮流
作为一款长达 12 年稳定运营的APP,宝星环球不仅展现了其卓越的品质,更成为时代创新的先行者。这一创新在其独特的功能和用户体验中得以体现,为用户提供了极 致的服务,深刻地提升了品牌形象。 首先,宝星环球以其高度人性化的界面设计赢得用户的赞誉。通过巧妙的设计,它将用户需求置于首位,为用户提供更加便捷、直观的操作体验。不论是新手还是老手,都能在�
谷歌开源Magika:AI驱动文件类型识别系统,提升用户安全
Google最近开源了一款名为Magika的文件类型识别系统,该系统由AI驱动,能够在毫秒级内准确识别超过100种不同的文件类型,包括二进制文件和文本文件。在Google内部,Magika被广泛应用于提升用户安全,主要用于对Gmail、Drive和安全浏览中的文件进行适当的安全检查和内容策略扫描。详细介绍和演示可以在其网站和GitHub页面上找到。