今日AI:阿里欲推AI电商产品“绘蛙”;北大团队发起复现Sora计划;ComfyUI LayerDiffusion正式上线;AI工具DUSt3R GitHub爆火
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI视野:阿里开源AnyText;Pika推出付费计划;阿里推文生3D数字人项目;Magnific AI图片分辨率扩大至10K*10K
阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。英伟达推新AI语音识别模型ParakeetNVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列先进的自动语音识别模型,与Suno.ai合作开发。只要四行代码就能让大模型窗口长度暴增,最高可增加3
AI视野:ChatGPT和API发生重大中断;GPTs分阶段推出计划延迟;中国第二批11个大模型备案获批;阿里将开源720亿参数大模型
11月9日凌晨,OpenAI在官网发布,ChatGPT和API发生重大中断,导致全球所有用户无法正常使用,宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复,但仍然不稳定,会继续进行安全监控。项目地址:https://github.com/PKU-YuanGroup/LanguageBindFACTOR:无需训练即可自动检测深度伪造技术最新发布的GitHub工具FACTOR采用事实核查技术来检测数字媒体,无需事先进行训练,能够自动检测深度伪�
“电子萝卜章”被阿里清华联手发起的“安全AI挑战者计划”攻破
9月7日消息,据悉,由阿里安全联合清华大学开启的“安全AI挑战者计划”第五期对抗赛上,“电子萝卜章”被攻破了。根据主办方的介绍,“安全AI挑战者计划”是全球首个AI领域的安全赛事,目标是通过全球最顶尖的安全AI赛事,面向未来培养更多新基建安全技术人才。第五期对抗赛的目标是针对证件资质文档类图像进行伪造及反伪造对抗,通过实战环境解决困扰多年的社会问题。?
阿里巴巴的全球性科研合作计划AIR启动2020年项目征集
DoNews 6月12日消息(记者 程梦玲)阿里巴巴的全球性科研合作计划AIR启动2020年项目征集。阿里今年开放了12个前沿领域的科研合作,量子技术首次位列其中。根据公开信息,阿里巴巴达摩院在2017年成立量子实验室开展技术攻坚。阿里巴巴表示,将继续向全球顶级高校和科研机构开放经济体的全场景资源。
阿里启动“AI豆计划” 在贫困地区培训相关职业人才
昨日,阿里巴巴联合中国妇基会启动了 “AI 豆计划”,贵州成为首个试点地区。据悉,“AI 豆计划”是阿里推出的“AI+扶贫” 的公益新模式。该计划将通过在贫困地区培训AI相关人才,帮助贫困群众实现就业脱贫。
阿里巴巴AI实验室推出“精灵产业带”计划
今日,阿里巴巴人工智能实验室宣布“精灵产业带”计划,通过芯片、模组厂商,以及技术方案商等产业链上下游合作,向产业带输送一整套智能升级方案。
阿里巴巴联手新加坡,计划将区块链、AI等技术引入高校
在三方合作中,阿里巴巴将开放AI的丰富应用场景及数据,达摩院科学家也将作为博士生导师授课,把先进的人工智能、云计算、区块链、IoT等技术场景引入新加坡高校。
AI日报:阿里发布紧凑型Qwen3-VL模型;科大讯飞AI翻译耳机全球首发;Gemini代码惊现Veo3.1
阿里巴巴发布紧凑型Qwen3-VL多模态模型,推动边缘设备AI应用;科大讯飞推出全球首款AI翻译耳机,支持60种语言实时翻译;谷歌NotebookLM集成图像生成功能,可将笔记转为动态视频;ChatGPT将于12月向成人开放限制内容并推出自定义交互功能;谷歌Gemini代码泄露Veo3.1视频模型升级迹象;马斯克宣布X平台将全面转向AI推荐系统;巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS;vivo公布X200系列影像升级计划;字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。
英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂
英特尔与新一代AI平台扣子联合发起“英特尔×扣子AI工坊高校计划”,旨在通过校企合作推动AI技术在教育领域的深度融合。该计划以校园场景化实践为核心,通过线下工作坊、创新挑战赛等形式,将前沿AI工具引入高校,帮助学生掌握AI应用能力。活动覆盖全国数百所高校,结合酷睿Ultra处理器的硬件优势,让学生直观体验AI在创作、学习等场景的高效赋能。未来双方计划深化课程共建与就业对接,构建AI教育新生态,助力青年适应智能时代发展需求。
AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型
本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。
AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型
AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。
阿里妈妈发布万相台AI无界:新流量新节奏之下的双11,AI是经营唯一解
电商生态持续演化。 闪购业务的爆发,为淘宝带来了大量新增用户和更高的下单频次;超级88购物节激活了更加轻量、日常的“小促”形式,消费者从一年一度的“囤货式购买”,转变为高频次的“循环式购买”;“红猫计划”则支持用户从小红书笔记直达淘宝货品链接,显著缩短转化链路。 这一系列变化揭示了:淘系在走向全域大消费平台的路上,新的流量场景正在涌现,新�
AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型
本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�
AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务
AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�
小米和阿里下场,正在改变AI百镜大战的局面
AI眼镜正从极客玩具发展为AI大模型落地的重要载体。2024年上半年,市场发布超10款新品,包括雷鸟、雷神等创业品牌及华为、创维等大厂产品。全球出货量激增,预计2025年中国市场将达290.7万台,同比增长121.1%。小米、阿里等巨头入局推动竞争升级,但行业仍面临芯片成本高、续航短、生态不足等挑战。未来大厂凭借供应链和生态优势或主导市场,而创业公司需在细分场景寻�
AI日报:国产版Nano Banana?即梦图片4.0发布;阿里巴巴发布 Qwen3-Max-Preview;上海重磅发布AI广告扶持政策
AI日报栏目聚焦人工智能领域最新动态。主要内容包括:即梦图集4.0发布,新增文生图、图像编辑等功能;阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview;小米AI眼镜上线支付宝“看一看”支付功能;微软开源14B参数模型rStar2-Agent在数学推理领域表现突出;MiniMax启动股权激励计划覆盖核心员工;谷歌明确Gemini使用限制,免费用户每日最多5次提示;上海发布AI广告扶持政策,最高补贴500万元。这些进展展示了AI技术在图像处理、语言模型、智能支付等领域的创新应用。
AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3
AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。
字节跳动回应即将发布AI眼镜:早期探索阶段 没有发布计划
近日,有媒体报道字节跳动即将推出一款AI眼镜产品,并详细披露了所谓的产品供应链信息,引发行业广泛关注。据传,该产品方案由RXKJ提供,MCU(微控制单元)由HXKJ供应,核心SOC采用高通AR1芯片,整机代工则交由LQKJ负责。 针对这一市场传闻,字节跳动相关负责人迅速作出回应。该负责人明确表示,相关产品目前还处在早期探索阶段,暂时没有明确的发布计划。
AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术
本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。