北大字节开辟图像生成新范式,超越Sora核心组件DiT,不再预测下一个token
北大和字节联手搞了个大的:提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件DiffusionTransformer。并且代码开源,短短几天已经揽下1.3k标星,登上GitHub趋势榜。他硕士毕业于浙江大学,目前的研究重点是视觉基础模型、深度生成模型和大语言模型。
北大字节提出图像生成新范式VAR 超越Sora核心组件DiT
北大与字节跳动AILab联合提出了一种图像生成新范式——VAR,这一新方法的核心在于预测下一级分辨率非传统的预测下一个token。VAR的提出不仅在图像生成质量上超越了Sora的核心组件DiffusionTransformer在推理速度上也实现了20倍以上的提升。VAR的开源也体现了学术界与工业界合作的积极成果,有助于推动整个AI领域的发展和创新。
AI公司面壁智能完成新一轮数亿元融资
面壁智能近日完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。这次融资将用于推进优秀人才引入,加固大模型发展的底层算力与数据基础,持续引领「高效大模型」路线,推动大模型高效训练、快步应用落地。他们已与招商银行、数科网维、知乎等合作伙伴合作,将大模型与Agent技术部署落地于金融、教育、政务、智能终端等应用场景。
成新一代许愿池!网友喊话雷军能不能生产一下相机
近日,小米汽车首款车型小米SU7上市后备受关注,一连多天霸占网络热搜,雷军打造现象级爆品的能力再次得到验证。小米雷军也成为了网友眼中的新一代许愿池,不少网友纷纷向雷军发出各种愿望,希望雷军能为自己圆梦。另有网友表示,雷军在科技互联网行业已足够成功,小米手机已经做成了世界级品牌,小米汽车也正在攀登高峰,对于我们国人言,不是雷军去做更多品牌更有益是要出现更多雷军这样的企业家。
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作Champ火爆全网。该模型仅开源5天GitHub即收获1k星,在Twitter更是「火出圈」,吸引了大量博主二创,浏览量总量达到300K。更多技术细节以及实验结果请参阅Champ原论文与代码,也可在HuggingFace或下载官方源码动手体验。
30天涨粉100万,AI猫猫“卖惨”成新晋流量密码
AI猫猫剧情号,火了。当魔性洗脑的“喵喵”音乐响起,一张张以猫猫为故事主角的画面,会像设定了自动播放的PPT一样呈现在你的眼前。这届网友之所以对AI猫猫剧情号上头,爱上的或许并不是AI生成的不存在的猫是那些能够引发情感共鸣、为电子猫注入灵魂的故事。
30天涨粉100万!AI猫猫剧情号火了 “卖惨”成新晋流量密码
AI猫猫剧情号成为了新的流量密码,在网络上掀起了一股热潮。这些视频以AI生成的猫猫为主角,通过悲惨的故事情节吸引了大量观众。在内容创作领域,AI技术的应用无疑为创作者提供了更多可能性,但成功仍然取决于创作者的创意和故事讲述能力。
AI公司生数科技完成新一轮数亿元融资 聚焦原生多模态赛道
生数科技是一家成立于2023年的公司,专注于多模态大模型的研发,包括图像、3D和视频等多种原生多模态大模型。他们的团队来自清华大学人工智能研究院和其他科技公司,拥有深厚的技术背景。公司还计划持续优化基础模型,特别是在长视频生成能力方面进行突破,并探索全新产品形态,致力于提升用户创造力和生产力。
阿里做了个“绘蛙”,AIGC搞电商营销将成新风口?
“AI电商时代刚刚开始,对谁都是机会,也是挑战”,这是去年11月末,拼多多市值即将追上阿里巴巴时,马云在阿里内网发帖的一部分。在创始人定调后,AI电商将会成为阿里未来的一个重点。虽然阿里对于AI电商的探索很有必要,但现阶段的相关技术还不足以支持它颠覆电商行业的既有格局。
两广地区家里水帘洞户外南天门 网友:墙壁代写成新“业务”
两广地区正在经历南方特有天气现象——回南天。这一天气现象导致室内镜子一团水雾,墙壁默默“淌泪”,楼梯地面布满水珠,甚至客厅都能成为滑行的场地。这一天气现象成为了网络上的热点话题,引发了许多有趣的评论和讨论。
“尔滨”火了,文旅账号狂飙:“文旅局长”成新晋网红IP?
想你的“疯”,这次“发”到了地方文旅账号。在山东淄博、哈尔滨相继卷出自己的“风味”后,各地文旅局长喜迎“别人家的孩子”,纷纷献出十八般武艺。迄今,地方文旅账号的内容风格主要被两种思路主导,其一是文化古城风。如安徽文旅以意境驱动,视频内容以地方景色辅以古诗词念白,颇为诗情画意。网友评价两极分化,有网友称其为互联网流量热潮中的一股清流�
Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
StableDiffusion要王者归来了?StabilityAICEOEmadMostaque最新推文,四段视频引人无数遐想。不少网友怀疑,这是StableVideoDiffusion新版本的演示Demo。又或者在可控性等上面去卷……这不就在前几天,runway的Gen-2再进化——只需5个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
Meta AI 推出可重新调整光线的高保真头像生成方法 可用于制作动画生成新颖的表情
在MetaAI的一项开创性研究中,研究人员成功解决了动态3D头像的高保真重新调整光线的挑战。传统方法在实时应用中捕捉面部表情的细节常常需要进行改进,尤其是对于捕捉亚毫米级细节的要求。通过将基于3D高斯函数的几何模型与革命性的可学习辐射转移外观模型相结合,研究团队超越了现有方法的局限,为头像的逼真程度树立了新的标准。
HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架
在3D生成领域,为了实现高质量的3D人体外观和几何形状,研究者们一直在探索自动化的生成方法。传统方法需要经历多个人工制作步骤最新的HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题。这一框架的开源将为相关研究者提供有力工具,推动3D生成领域的发展。
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。作为最早探索视频生成领域的领头羊之一,Runway升级了其Gen-2模型,带来了电影级别的高清晰度,令人瞩目,并称视频生成的一致性得到了重大改进。官网的信息显示,目前还在积极地迭代模型效果中,未来2-3个月内就会放出人人可以试用的模型。
视频生成新突破!PixelDance还可以做复杂动作和特殊效果
视频生成技术取得了显著的进展,其中PixelDance成为焦点。相较于其他模型如Runway的Gen-2、Meta的EmuVideo、Stability.ai的SVD等,PixelDance在生成高度一致性和丰富动态性的视频方面表现出色。PixelDance将进一步迭代模型效果,并在2-3个月内放出供人们试用的模型,为创作者提供更多可能性。
双11落幕!年轻人精致省钱成新风潮:被评为“炫省一族”
今年双11已经落幕,根据天猫发布的双11战报,今年双11共有402个品牌成交破亿,其中有243个是国货品牌,3.8万个品牌成交同比增长超过100%。随着双11的落幕,社交媒体上分享怎么样买到便宜货物的网友越来越多,精致省钱成为一种风潮,他们被评为炫省一族”。因此可以看到,理性和品质消费新趋势将引领市场更加注重商品品质,并催生更加丰富、多元的服务模式。
谷歌财报:搜索广告依旧稳健 人工智能搜素或成新收入来源
谷歌母公司Alphabet最近公布了2022年第三季度财报,显示谷歌核心广告业务收入440亿美元,同比增长11%,保持强劲增长态势。YouTube广告收入也达到79亿美元,增长超过12%。随着人工智能技术在各行各业的应用日益广泛,为企业客户提供人工智能服务也将成为谷歌新的利润增长点。