字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。更多大模型算法相关岗位开放中。
Nothing Phone 1在Nothing OS 2.5.5更新中集成ChatGPT
NothingPhone1终于在NothingOS2.5.5更新中获得了ChatGPT集成。该更新还带来了新功能、修复以及ChatGPT集成。NothingOS2.5.5正在逐步推出,因此,如果在您的设备上未出现,请等待5到6天后再次检查。
小米SU7计划5月初推送首次OTA:无线CarPlay将上线!iPhone用户最优选
雷军在今天上午的小米汽车北京车展发布会上透露,小米SU7计划5月进行发布后的首次OTA1.1。将上线大家期待已久的无线CarPlay功能、端到端代客泊车等智驾体验。小米SU7还将在5月底计划进行第二次OTA,1.2版本将正式发布城市领航功能,开通10城。
小米SU7最新OTA计划公布:5月两拨推送 城市领航开通10城
今天在北京车展上,雷军公布了小米SU7的最新OTA计划。小米SU7计划在5月初进行第一次OTA,新增支持无线CarPlay;5月底计划第二次OTA,城市NOA开通10城。小米汽车还将不断扩充销售门店和服务中心,目标2024年底销售门店覆盖46城219家、服务中心覆盖86城143家。
iOS 17.5开发者预览版Beta 2发布:支持网页下载App 苹果还要继续收费
今天凌晨,苹果推送了iOS17.5开发者预览版Beta2系统。苹果已经为iOS17.5加入了网页上下载安装App的功能,允许开发者直接在其网站上提供App以供下载。非营利组织、经认可的教育机构和政府实体免收该费用。
moto G64 5G正式发布:搭载120Hz刷新率和6000mAh大电池
4月16日,motoG645G在印度正式发布。这款手机是世界上第一款采用联发科Dimensity7025芯片组的手机,搭载了6000mAh大电池、杜比全景声和IP52防尘防水等级。HDFC银行的信用卡和借记卡持有人可以享受高达1100卢比的折扣优惠。
出门问问发布2.5D数字人系统 WetaAvatar 4.0
出门问问最新发布的WetaAvatar4.0是一款基于多尺度3D模型的数字人系统,具有高度真实的外观和生动的表情,表现优于前代系统。这一先进技术已经成功部署在出门问问的AIGC产品——「奇妙元」和「奇妙问」中。出门问问将继续探索创新,为用户提供高质量的数字人使用体验,将数字人技术应用于更广泛的产品服务中,实现智慧生活的新潮。
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作Champ火爆全网。该模型仅开源5天GitHub即收获1k星,在Twitter更是「火出圈」,吸引了大量博主二创,浏览量总量达到300K。更多技术细节以及实验结果请参阅Champ原论文与代码,也可在HuggingFace或下载官方源码动手体验。
Moto G64 5G即将发布 天玑7020 安卓13
摩托罗拉公司即将推出一款名为MotoG645G的新手机。该手机有望于四月份正式发布,并将接替去年推出的G54机型成为中端产品。让我们拭目以待它在市场上的表现吧!
独立开发变现周刊(第125期):个人Notion如何每月收入3万美元
目录1、Clipwing:一个一个超级简单的视频编辑器2、Flarum:一款开源简洁的论坛平台3、TinyLetter:一个简易的电子邮件订阅服务平台4、个人Notion业务如何月赚3万美元1、Clipwing:一个一个超级简单的视频编辑器我已经建立Clipwing6个月了。尽管有用户,但还没有付费用户。通过采取一些行动来开始让事情变得清晰起来。
英伟达发布Nemotron-4 15B: 8 万亿训练数据,性能超LLaMA-2
英伟达最新推出的大型语言模型Nemotron-415B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,基于庞大的8万亿文本标注数据进行了预训练。这一成就为大型语言模型的发展和应用提供了崭新的视角。
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。谷歌研究人员表示,ScreenAI模型还需要在一些任务上进行更多研究,以缩小与GPT-4和Gemini等更大模型的差距。
Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话
MetaAI最近发布了MMCSG数据集,该数据集包含使用ProjectAria录制的25小时以上的双向对话。CHiME-8MMCSG任务的重点是转录使用智能眼镜录制的对话,这些眼镜配备了多个传感器,包括麦克风、摄像头和惯性测量单元。MMCSG数据集的提供为在动态现实环境中开发和评估转录系统提供了宝贵资源。
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。这种能力凸显了Nemotron-415B对广泛的自然语言的深刻理解。
保留LED灯和透明背板!Nothing Phone 2a将于3月5日推出:配天玑7200芯
NothingPhone已推出了2款手机,如今正准备于3月5日推出旗下的第三款手机NothingPhone2a。NothingPhone2a将延续前两代机型的设计风格,保留了LED灯和透明背板。Nothing官方已宣布将于美国东部时间3月5日上午6:30正式发布NothingPhone2a。
AI视野:OpenAI推新模型GPT-4-0125-preview;阿里Qwen-VL升级更新;苹果播客新增转录功能;AI写真项目InstantID在GitHub爆火
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
同级无敌1.5K屏 IP68!Redmi Note 13 Pro系列512GB降价:1799元起
今天RedmiNote13Pro系列宣布512GB直降100元活动,共四款配置参与。Note13Pro的12512GB1999元、16512GB2099元。值得注意的是,Note13Pro还支持了IP68防尘防水,这是以往很多高端旗舰才会配备的功能,可以在关键时候救手机一命,使用更安心。
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
StabilityAI公司发布了其首个新型人工智能模型,商业许可的StableCode3B。字节复旦团队提出metaprompts扩散模型图像理解力刷新SOTA过去一年,扩散模型逐渐在文生图领域扩展,能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案,旨在提高模型在视觉识别任务中的性能。
iQOO 12/Neo9系列推送“护眼”OTA:2160Hz全高频调光上线
随着大家对于护眼越来越重视,OLED手机的高频PWM调光已经成了必备规格。iQOO官方宣布为iQOO12、iQOONeo9系列推送全新OTA,2160Hz全高频调光正式上线,覆盖2-600nit日常使用场景,SVM最低可达0.03。iQOO系列更是行业首发2KE7144Hz全感屏,采用三星最新的E7发光材料,峰值亮度可达3000nit,全局亮度1600nit,通过了SGS低蓝光认证。
真我将推出Note系列手机:1月24日发布 搭载天玑7050
据知名数码博主@数码闲聊站透露,realme真我将推出全新的Note系列机型,主打中低端市场。该系列机型将为用户带来出色的性能和体验。GPU部分则配备了Mali-G68MC4,支持LPDDR5/4x和UFS3.1/2.1存储规格,让整体性能更上一层楼。