字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。更多大模型算法相关岗位开放中。
特斯拉市值一夜涨超1800亿 8月8日将发布Robotaxi
在美东时间4月8日这一交易日结束时,备受瞩目的特斯拉公司在这一天实现了显著的增长,其股价上涨了4.9%,市值因此增加了257亿美元,换算成人民币约为1860亿元。这一涨幅引起了市场的广泛关注,并成为了当天的热门话题。特斯拉的市值一夜之间飙升超过1800亿元人民币,这背后离不开公司近期的积极动向和战略部署。特斯拉的CEO马斯克近期�
Nothing Phone 2即将亮相!新机内部代号为“PacManPro”
Nothing计划推出改良版Phone,内部开发代号为“PacManPro”。这款新手机预计会在设计、处理器以及其他方面进行调整。这让人不禁猜测,Nothing会不会在接下来的日子里带来更多令人惊喜的产品。
特斯拉重磅新车官宣!马斯克:8月8日发布无人驾驶出租车robotaxi
特斯拉CEO埃隆马斯克今日在社交平台X上发贴称,公司将于8月8日发布其承诺已久的无人驾驶出租车。robotaxi将基于特斯拉的下一代电动车平台打造。使用FSD和Autopilot的特斯拉车辆已发生数百起事故,造成数十人死亡。
英伟达发布Nemotron-4 15B: 8 万亿训练数据,性能超LLaMA-2
英伟达最新推出的大型语言模型Nemotron-415B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,基于庞大的8万亿文本标注数据进行了预训练。这一成就为大型语言模型的发展和应用提供了崭新的视角。
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。谷歌研究人员表示,ScreenAI模型还需要在一些任务上进行更多研究,以缩小与GPT-4和Gemini等更大模型的差距。
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。这种能力凸显了Nemotron-415B对广泛的自然语言的深刻理解。
同级无敌1.5K屏 IP68!Redmi Note 13 Pro系列512GB降价:1799元起
今天RedmiNote13Pro系列宣布512GB直降100元活动,共四款配置参与。Note13Pro的12512GB1999元、16512GB2099元。值得注意的是,Note13Pro还支持了IP68防尘防水,这是以往很多高端旗舰才会配备的功能,可以在关键时候救手机一命,使用更安心。
Meta推机器人框架OK-Robot 机器人收拾房间就要实现了?
Meta和纽约大学合作开发的机器人框架OK-Robot,让我们离实现机器人收拾房间的目标又近了一步。这一新型开放知识型机器人框架融合了前沿的视觉语言模型来识别物体,预先训练好的机器人抓取模型,以及经过实战考验的算法,如1968年的A*算法用于导航。这一成果为机器人在家庭环境中执行日常任务提供了新的可能性。
Redmi Note 13 Pro 2024新春版首曝:红色机身太喜庆
临近农历春节,各大手机厂商也相继推出与新年相关的特别版本。有数码博主、小红书网友晒出了即将发布的RedmiNote13Pro2024新春版,新机后盖采用大红配色,十分喜庆,手机盒也换上新装,极具新春感。RedmiNote13Pro内置5100mAh电池,支持67W快充,配备2亿像素主摄、800万像素超广角和200万像素微距镜头。
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
StabilityAI公司发布了其首个新型人工智能模型,商业许可的StableCode3B。字节复旦团队提出metaprompts扩散模型图像理解力刷新SOTA过去一年,扩散模型逐渐在文生图领域扩展,能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案,旨在提高模型在视觉识别任务中的性能。
字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA
过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。随着技术的进步,这些方法可能会进一步完善。
iQOO 12/Neo9系列推送“护眼”OTA:2160Hz全高频调光上线
随着大家对于护眼越来越重视,OLED手机的高频PWM调光已经成了必备规格。iQOO官方宣布为iQOO12、iQOONeo9系列推送全新OTA,2160Hz全高频调光正式上线,覆盖2-600nit日常使用场景,SVM最低可达0.03。iQOO系列更是行业首发2KE7144Hz全感屏,采用三星最新的E7发光材料,峰值亮度可达3000nit,全局亮度1600nit,通过了SGS低蓝光认证。
充电速度最高提升28%!广汽埃安多款车型开启推送OTA
AIONYPlus、AIONSPlus、AIONSMAX三款车型将迎来最新版本的OTA。此次OTA升级主要将针对充电速度进行优化。2023年12月28日上午,广汽埃安迎来了100万辆的新里程碑,不仅成为全球最快破百万的纯电品牌和新能源品牌,同时也是全球最快破百万的汽车品牌。
iPhone 16 Pro 进入Proto 2阶段:重大变更来了!
苹果公司正在开发iPhone16Pro产品,并已进入“Proto2”阶段。该公司决定改变之前的设计,将操作按钮设计与iPhone15Pro型号相似。我们期待着更多关于iPhone16Pro的消息的出现。
1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
只需两分钟,玩转图片转3D!还是高纹理质量、多视角高一致性的那种。不管是什么物种,输入时的单视图图像还是这样婶儿的:两分钟后,3D版大功告成:△上,Repaint123;下,Repaint123新方法名为Repaint123,核心思想是将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力相结合,来生成高质量、多视角一致的图像。作者也对论文使用的每个模块的有效性以及视角转动增量进行�
新增荔枝播客App!理想L系列将迎OTA 5.0.2:支持一键播放、订阅等功能
理想L系列将迎OTA5.0.2版本。此次升级将增加荔枝播客App,并对全场景智能驾驶NOA、全场景辅助驾驶LCC和智能泊车体验进行优化。理想汽车还暂未公布OTA升级的更多信息,更多消息,我们将持续为您报道。
Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象
MetaAI最近发布了一项引人注目的技术,他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。这个系统能够根据多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。我们可以期待在不久的将来,这种技术将成为我们生活中不可或缺的一部分。
全球最强「开源版Gemini」诞生!全能多模态模型Emu2登热榜,多项任务刷新SOTA
【新智元导读】最强的全能多模态模型来了!就在近日,智源研究院重磅发布了开源界的「Gemini」——Emu2,一口气刷新多项SOTA。过去的18个月里,我们见证了AI领域许多重要的时刻。相比Emu1,Emu2使用了更简单的建模框架、训练了更好的从特征重建原图的解码器、并把模型规模化到37B参数。
Redmi K70/K70 Pro OTA升级发布!屏幕频闪比友商更低
日前,Redmi市场总经理、Redmi品牌发言人王腾微博发文对屏幕SVM”进行了科普,同时宣布将为RedmiK70、K70Pro推送OTA升级,终结友商数字游戏。Redmi手机宣布,K70、K70Pro全量升级今日起陆续上线,升级后屏幕SVM低于0.1,号称小米青山护眼再进化”。但鉴于友商一直在大肆宣传这个指标,所以才有了本次K70、K70Pro的OTA升级,升级后SVM比友商更低。