行业首发!荣耀Magic6系列搭载1200点dTOF激光器件:业界最快对焦
荣耀Magic6系列今晚正式发布,新机在影像方面具有巨大提升,业界首发搭载1200点dTOF激光器件。荣耀Magic6至臻版和荣耀Magic6RSR保时捷设计搭载了1200点阵列dTOF激光器件,是业界首次落地的大面阵高分辨率激光器件。让用户在拍摄时可以快速选择对焦模式,无论自动还是手动对焦模式,乃至锁定对焦等操作,都可高效、流畅实现。
MDTv2开源,Sora 核心组件 DiT 训练提速 10 倍
由颜水成和程明明领衔的研究团队在Sora核心技术上进行了重要的升级,推出了MaskedDiffusionTransformerV2。该模型在ImageNetbenchmark上取得了惊人的成绩,FIDscore达到1.58,刷新了State-of-the-Art。这一工作符合Sora的期望,通过生成模型构建物理世界模拟器的理念,为未来的表征学习和生成学习研究提供了有力的启示。
在线购物“虚拟试穿”模型Diffuse to Choose(DTC) 可将任何商品完美放入任何环境中
DiffusetoChoose是一种新型的虚拟试穿技术,它允许用户将任何商品放入任何环境中,实现逼真的在线购物体验。这一模型能够更好地捕捉商品的细节,并提升修复质量,同时保证产品在不同环境中看起来自然和真实。这一模型大大提高了用户对产品在真实环境中的样子的了解,进一步提升了在线购物的体验。
3DTopia官网体验入口 AI快速生成文本到3D模型软件在线使用地址
3DTopia是一款先进的文本到3D生成模型,通过两阶段的处理,能在短短5分钟内实现高质量的文本到3D模型的生成。这一创新工具的应用范围广泛,特别适合那些需要快速生成3D物体、进行文本图像转换、以及从事3D设计的用户。点击前往3DTopia官网体验入口并亲身感受这一创新工具的魅力。
最新文生3D基础模型 3DTopia,五分钟生成一件 “3D 展品”
来自南洋理工大学、上海AI实验室等机构的研究人员共同推出了一款名为3DTopia的新款文生3D基础模型。这个模型可以在短短五分钟内生成出多样化、高精度的3D模型,让人仿佛置身于一个“魔法博物馆”之中。随着AI技术的不断发展,像3DTopia这样的模型将为我们带来更多创造的可能性。
南大提出全新框架VividTalk 一张照片一段声音秒生超逼真视频
南大等机构的研究人员推出了一项引人注目的研究成果——VividTalk框架,其能够通过一段音频和一张照片实现令人惊叹的说话视频生成。这一通用框架采用了两阶段生成方法,首先通过考虑面部运动和blendshape分布之间的映射,利用多分支Transformer网络建模音频上下文,生成3D驱动的网格。这项研究成果将有望在虚拟人物、语音合成和视频制作等领域产生深远的影响。
苹果零售店Presto专用设备曝光 可为未拆解iPhone升级系统
苹果公司计划在美国的零售店推出一项名为“PrestowithinApple”的新服务。这项服务将允许苹果员工使用一款名为“Presto”的专用设备,为未拆封的iPhone进行无线软件更新,让消费者购买新iPhone后马上就能使用最新的iOS系统,无需花费时间去升级。这也意味着,在未来几年内,苹果将继续保持其智能手机产品的领先地位,并不断推动智能手机技术的发展。
小米SU7配备一键Boost:弹射起步 20秒扭矩峰值输出
小米汽车首款车型小米SU7今晚正式登场,该车定位C级高性能生态科技轿车”,是科技大厂”小米迈入新能源赛道的首次成果落地。小米SU7不仅外观炫酷,更拥有强大的动力性能。这些配置共同保证了车辆在转弯、制动等关键操作中的超一流性能,转弯半径仅为5.7米,百零制动距离仅为33.3米,为驾驶者带来了更加安心和自信的驾驶体验。
零百加速仅2.78秒 小米SU7核心动力性能碾压保时捷Taycan
今日晚间的小米汽车上市发布会,小米SU7正式登场。小米SU7是一辆驾驶者之车,零百加速2.78秒,为50万以内速度最快的量产车。作为电动车的最大对手低温”,小米SU7也进行了专项优化,在-15℃低温下,小米SU7仍保证了3.38秒的加速性能,远超特斯拉Model3高性能版的6.35秒。
Adobe推营销专用跨渠道活动工具集Adobe GenStudio
Adobe昨日推出了一款全新的产品——AdobeGenStudio,这是一个专为营销人员设计的跨渠道活动工具集。GenStudio是基于生成式人工智能构建的,它可以帮助营销团队在多个平台上轻松地规划、制作、管理、发布以及评估与品牌形象一致的内容。AdobeGenStudio是一个强大的营销工具,它将AI技术和传统的营销策略相结合,为营销人员提供了一个全面且高效的工作平台。
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
【新智元导读】Claude3在通用任务上是全球最强已经毋庸置疑。更令人惊叹的是,它在专业领域的表现,比如化学任务,也能远远领先GPT-4。可以预想到,作为通用模型来设计的LLM,会在专业领域逐渐爆发。
理想汽车 Mind GPT 多模态认知大模型通过国家备案
理想汽车宣布其全自研的多模态认知大模型——MindGPT,已正式通过国家《生成式人工智能服务管理暂行办法》的备案。这一里程碑式的事件标志着理想汽车成为首个通过该备案的汽车厂商自研大模型。它不仅支持方言自由说、指令自由说具备简洁模式以及全时全车免唤醒的能力,为用户提供了更加便捷、智能的交互体验。
DBRX抢占开源大模型王座 编程、数学等领域超越GPT-3.5
最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型在效率上有所突破。随着其在各项基准测试中的优异表现,DBRX有望成为未来开源大模型发展的重要里程碑,为人工智能领域的进步贡献力量。
全面对标GPT4 Turbo!科大讯飞刘聪:6月发布星火大模型V4.0版本
科大讯飞副总裁、研究院院长刘聪在博鳌2024年会现场表示:科大讯飞计划在今年6月,正式发布对标GPT-4当前能力的星火大模型V4.0版本。讯飞星火大模型V4.0目前正在训练中。刘庆峰表示,星火大模型的背后,是科大讯飞多年的研究和技术积累,多年来研发团队不断探索和改进各种算法和模型,以解决语言理解和推理中的挑战。
Heygen发布Avatar in Motion 1.0新功能 不只对口型,还能复制你的动作、姿态
Heygen近期发布了其AvatarinMotion1.0新功能,这一技术革新在虚拟角色动作捕捉和声音克隆方面取得了重大突破。该功能可以精确地保持口型同步,并克隆用户的语音语调,甚至能保留背景声,使得虚拟角色的语音表达更为生动真实。所以,如果她在海边卖贝壳、那她肯定是卖海边贝壳的。
DataCamp官网体验入口 数据科学AI在线免费课程资源学习地址
DataCamp是一个在线学习平台,专注于提供数据科学、AI及相关领域的课程。它为用户提供了动手实践的学习体验,包含交互式练习和短视频,涵盖了多种话题,如Python、R、SQL、ChatGPT和PowerBI。开始您的学习之旅,探索无限可能!
Meta推新框架OPT2I 提高SD图像生成一致性
Meta公司最近推出了一款名为OPT2I的新框架,该框架利用大型语言模型来提高SD图像从提示词到图像的生成过程中的一致性。OPT2I是一个优化框架,旨在提升T2I模型中的提示-图像一致性。OPT2I框架为提高T2I模型的提示-图像一致性提供了一种新的有效方法。
AniPortrait官网体验入口 腾讯AI音频驱动人脸动画生成工具免费使用地址
AniPortrait是一个根据音频和图像输入生成会说话、唱歌的动态视频的项目。它能够根据音频和静态人脸图片生成逼真的人脸动画,口型保持一致。想要了解更多关于AniPortrait的信息并开始体验音频驱动人脸动画生成工具,请访问AniPortrait官方网站。
TOXCL:用于检测和解释隐性有毒言论的统一AI框架
社交媒体上的毒性言论可能会像野火般蔓延,特别是针对个人和边缘化群体。明显的仇恨言论相对容易被发现,但隐含毒性——依赖于刻板印象和编码语言不是明显的侮辱——提出了更为棘手的挑战。但通过谨慎使用,它为赋予边缘化声音权力和遏制网络上的压制性言论提供了一条道路。
抖音有个叫Mortal的网友 一个作品都没 却拥有400万粉丝
在抖音,有个ID叫作Mortal”的网友,尽管没有发布任何作品,却拥有400万粉丝。这个网友的账号简介中只写了一句话:求复活卷轴一张没有就算了”,引起了人们的好奇。”ta求复活卷轴的留言引发了很多网友的共鸣,触动了人们对生命的思考和感悟。