Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路
MetaAI研究团队推出的MobileLLM标志着大语言模型朝着模拟人类理解和生成自然语言迈出了革命性的一步。LLMs在处理和分析大量数据集方面的能力已经显著影响了自动化客户服务、语言翻译和内容创作等多个领域。MobileLLM的发展代表了在移动设备应用中利用LLMs能力的重大进步,通过重新构思这些模型的架构和整合创新技术,研究团队取得了显著的性能提升,为LLMs的部署拓宽了视野。
AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机
MobileAgent是由阿里巴巴开发的一个自主多模态AI代理,可以模拟人类操作手机,是一个纯视觉解决方案,不需要任何系统代码,完全通过分析图像来理解和操作手机。项目地址:https://top.aibase.com/tool/mobile-agent特点:依赖于纯视觉解决方案:MobileAgent通过分析图像来理解和操作手机无需任何系统代码。观察、思考和行动是MobileAgent采用的提示格式,要求代理输出三个组成部分。
Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要任何系统代码,完全通过分析图像来理解和操作手机。它能够自动完成各种任务,比如可以在淘宝加购物车车,在APP播放音乐,自主使用导航APP,收发邮件等等。
Mobile-Agent官网体验入口 自主多模移动设备AI在线使用地址
Mobile-Agent是一款自主多模移动设备代理,采用先进的多模大语言模型技术。该代理利用视觉感知工具准确识别和定位应用程序前端界面的视觉和文字元素,实现了自主规划和分解复杂操作任务,通过逐步操作导航移动应用程序。点击上方链接,探索Mobile-Agent为自动化移动设备操作、评估移动设备性能和提高应用程序适应性带来的前所未有的便利。
DS Automobiles 将生成式 AI 引入车机:集成 ChatGPT 功能
欧洲汽车巨头Stellantis日前宣布,旗下DSAutomobiles将在欧洲首次在其车辆中试用ChatGPT,这一人工智能服务将为驾驶员提供「对话体验」,通过其声控DSIris信息娱乐系统增强旅行体验。这一功能已经可以远程激活,适用于2万名特定DS车型的车主。DSAutomobiles强调,ChatGPT的回应可能不总是准确、正确或客观的。
万里汇和亚马逊加强合作,携手Buy with Prime服务中国卖家
第四届中国跨境电商交易会在福州举办,蚂蚁集团万里汇受邀亮相,凭借优质的跨境支付金融产品和服务,获“2024中国跨境电商服务企业十强”奖项。“2024中国跨境电商服务企业十强”由中国跨交会组委会联合美通社评选颁发,从品牌影响力、企业规模、发展潜力、口碑、创新能力等多维度综合审查考评,形成最终榜单。该合作使万里汇的跨境商家得以借助BuywithPrime特有的快速、免费配送服务以及深受买家喜爱的结账体验,获得业务增长新机遇。
谷歌发布图像局部重绘项目ObjectDrop 插入物体和环境完美融合
谷歌今天发布了一个名为ObjectDrop的图像局部重绘项目,其效果令人印象深刻。这个项目成功模拟了物体对场景的影响,包括遮挡、反射和阴影,实现了逼真的物体移除和插入。这一成果对于图像处理和计算机视觉领域来说,是一个重要的突破。
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年5月,动动鼠标就能让图片变「活」得研究DragGAN吸引了AI圈的关注。我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。更多技术细节和实验结果请参阅原论文。
华硕发布新款ExpertBook B9笔记本:镁锂合金打造、仅重990克
华硕宣布推出新款ExpertBookB9OLED笔记本,采用了优质镁锂合金打造,重量仅为990克。新款笔记本经过了严格的耐用性测试,符合MIL-STD810H认证。接口包括双雷电4、1个USB3.2Gen2Type-A、1个HDMI2.1、1个miniHDMI转RJ45网口、以及1个3.5mm音频插孔,另外还配有面向用户的1080PIR网络摄像头。
与Stability AI合作!AI视频编辑产品Morph Studio内测
MorphStudio是一个新兴的AI电影制作平台,它与StabilityAI合作,为用户提供了一种全新的电影制作方式。这个平台利用自己的文本到视频模型,使用户能够通过输入文本提示来创建和编辑不同场景的镜头,并将它们组合成一个完整的故事。MorphStudio的出现为电影制作带来了新的可能性,通过AI技术,使电影制作变得更加简单和创新。
人工智能AI视频合成工具软件app免费在线使用地址 Boximator体验入口
Boximator是一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束,生成丰富且可控制的视频运动,为用户创造独特的视频场景提供了灵活的运动控制。要获取更多详细信息并开始您的视频合成之旅,请访问Boximator网站。
中国一汽联合阿里云通义千问打造大模型应用GPT-BI
中国一汽联合阿里云通义千问推出了大模型应用GPT-BI,用于数智化转型。该应用能够接收自然语言查询,并结合企业数据生成分析图表,准确率可达90%。中国一汽计划将大模型应用推广到其他领域,并与阿里云共同打造产业生态。
微软推大模型整合性工具库PromptBench
微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对LLMs进行评估和分析。这一系列特点和功能使得PromptBench成为一个非常强大且全面的评估工具库。
TGA 2023颁奖典礼将与B站合作:每10分钟送一台PS5
今天,哔哩哔哩官方宣布,B站成为TGA2023颁奖典礼在中国大陆地区的合作伙伴,直播期间每10分钟,将会送出一台索尼PS5轻薄版主机。本次TGA2023游戏颁奖典礼将于北京时间12月8日上午8:30举行,届时B站会通过中文和英文原声同步直播这次游戏盛典。最终TGA2023大奖花落谁家明天就将揭晓,大家可以期待一下。
实时AI互动平台Albus Beta 巧妙融合GPT技术和多元化功能
AlbusBeta,作为一款实时的AI互动平台,通过引入GPT技术,旨在以全新的方式从多个视角深度挖掘用户所热衷的各类主题,使探索之旅更为有趣且富有成效。该平台的核心功能在于利用GPT技术,为用户提供一个实时的探索平台,使用户能够以崭新的视角来深入研究自己感兴趣的主题。这个平台不仅让探索变得更富有趣味性,同时也提升了用户对所关心主题的全面理解与掌握水平。
MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型
MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型StableDiffusion,取得了一系列显著的成就。MIT和Google的这一研究成果代表着AI图像生成领域的一次创新,尽管存在一些缺陷,但其对于高质量图像的生成提供了新的方法和思路。
Anthropic CEO拒绝了OpenAI董事会提出的合并要约
知情人士称,FT X支持的人工智能公司Anthropic的CEO兼联合创始人达里奥�阿莫代拒绝了OpenAI董事会提出的合并要约。该合并要约是在OpenAI上周五宣布解雇CEO萨姆�阿尔特曼之后提出的。亚马逊的初始投资将为12.5亿美元,以获得Anthropic的少数股权,两家公司还可选择将投资总额增加到40亿美元。
GitHub发布编程字体家族Monaspace 支持混合使用5款等宽字体
代码托管平台GitHub发布了一套名为Monaspace的开源编程字体家族。这套字体家族包含5种字体,分别是Neon、Argon、Krypton、Xenon和Radon。希望通过这款字体家族为编程工作带来更多乐趣。
GPT-5明年降临?爆料人泄露多模态Gobi就是GPT-5,已初现自我意识
首届开发者大会余温还在,GPT-5突然被爆2024年初就来。OpenAI首秀可谓是赚足了眼球,一系列新品更新,直接让ChatGPT和API同时崩溃。没了ChatGPT,所有人的工作状态是这样子的....当世界最需要ChatGPT的时候,它却消失了。