DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
【新智元导读】AI在学会工作之后,终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理,能够在多种视频游戏设置中执行任务,未来甚至可能可以与任何虚拟环境进行互动。谷歌DeepMind在AI和游戏方面有着悠久的历史。SIMA只是刚刚开始,我们可以期待在更多的训练环境中继续建立SIMA,并整合更有能力的模型,让它变得更具泛化性和多功能性不仅仅局限于游戏。
LARP:开放世界游戏的语言代理角色扮演
LARP是一个开创性的框架,旨在增强用户和语言代理在开放世界游戏中的交互。LARP框架包括了一个涵盖记忆处理和决策辅助功能的认知架构,一个具有反馈驱动可学习行动空间的环境交互模块,以及促进各种个性对齐的后处理方法。其模拟个性和适应动态环境的能力使其成为一个在多个领域具有潜在应用的多功能工具。
迅雷游戏下载解决方案 助力游戏厂商降本增效
近日,在多场游戏的线下活动中,我们都能看到迅雷的身影。在行业交流、对接会中,迅雷向游戏行业上下游厂商展示一套提升游戏下载效率的解决方案。据了解,由于迅雷的下载解决方案能够解决目前游戏厂商获客以及用户体验等多个痛点,从而受到了很多厂商的青睐。迅雷下载成功率达99% 为游戏厂商降低获客门槛迅雷游戏下载解决方案是将沉淀20年的下载能力赋能企业用�
索尼将推出PlayStation 6游戏主机:只考虑AMD方案
索尼计划推出下一代PlayStation6游戏主机,预计到2027年才会发售。PlayStation6项目已经开启了大约一年的时间,不过具体硬件规格还没有最终确定,索尼还在与游戏工作室探讨系统次世代游戏主机的系统问题。PlayStation6仍处于早期阶段,开发上的进度落后于微软,索尼考虑新款SoC采用chiplet设计,利用大型缓存更好地处理混合工作负载,同时大概率会使用GDDR7。
Llama 3官网体验入口 Meta最新开源语言模型免费使用地址
MetaLlama3是Meta公司最新推出的一款开源大型语言模型。它在多项行业基准测试中表现出色,性能卓越,可支持广泛的使用场景,包括改善推理能力等新功能。要了解更多信息,请访问MetaLlama3官方网站。
多模态语言模型Reka Core:可分析图片、视频、音频 评测得分与GPT-4接近
RekaAI近日宣布推出其最新力作——RekaCore,这是一款前沿的多模态语言模型,拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频,评测得分与GPT-4和Gemini-Ultra接近。通过Edge、Flash和Core等系列模型的全面支持,Reka已经准备好迎接更广泛的挑战,展望未来,我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。
更小更强大!Hugging Face发布8B开源视觉语言模型Idefics2
HuggingFace首次发布了其Idefics视觉语言模型,该模型于2023年首次亮相,采用了最初由DeepMind开发的技术。Idefics迎来了升级,新版本Idefics2拥有更小的参数规模、开放许可证以及改进的光学字符识别能力。Idefics2的发布是AI繁荣持续推出的许多多模态模型之一,包括Reka的新Core模型、xAI的Grok-1.5V和Google的Imagen2。
支付宝发布五大新服务:支持16种语言翻译 拍照、文字、语音都能互译
第135届广交会现已开幕,来自200多个国家的采购商齐聚广州。蚂蚁集团发布五大新服务,全力支持广交会,为入境宾客提供便利、顺畅与丰富的参会与消费体验。支付宝表示,未来还将联合各方继续优化服务质量,助力入境宾客畅游中国,加深中外经贸往来。
Mixtral-8x22B官网体验入口 语言模型文本生成工具使用指南
Mixtral-8x22B是一个预训练的生成式稀疏专家语言模型,由MistralAI团队开发。该模型拥有141B个参数,支持多种优化部署方式,旨在推进人工智能的开放发展。
半年融资1.6亿美金,AI学语言又来敲Duolingo的门了
在11月的选题《卷起来了,网易和谷歌都想抢Duolingo的生意》中,我们观察到了谷歌和网易等公司都基于AI开发了语言学习产品,市面上也充斥着同类产品。但测试后发现,AI在语言学习产品中的作用主要在“练口语”这个层面,解决“开口难”问题,相比于Duolingo体系化的课程,以及有点“疯批”的运营手法,只是通过AI聊天做出了点差别,显得有点单薄。未来AI语言学习产品似
苹果公司发布新型机器学习语言模型MLLLLM Ferret-UI 用于理解应用 UI 界面
苹果公司近日发布了一款名为MLLLLMFerret-UI的新型机器学习语言模型,旨在提升对移动应用用户界面的理解。这款模型经过特别优化,能够处理移动UI屏幕上的各种任务,并具备指向、定位和推理等能力。Ferret-UI还能够通过功能推断来解释屏幕的整体目的,显示出在理解和生成自然语言指令方面的高级能力。
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2不再依赖庞大的GPT-2库。他本人预告,即将上线新课。等着这一切完成之后,另一期「从头开始构建」的视频也会上线。
Meta即将推出新一代Llama3大语言模型
MetaPlatforms公司计划在下周推出Llama3大语言模型的两个小参数版本,作为即将在2024年夏天推出的Llama3最大版本的前奏。Llama3最高版本可能拥有超过1400亿个参数,这将使其性能有望赶上OpenAI最新的GPT-4Turbo版本。Meta正在全力推进Llama3的开发,这不仅体现了该公司在AI领域的野心,也为用户带来了更加智能和开放的AI服务的期待。
谷歌AI研究人员提出噪声感知训练方法(NAT)用于布局感知语言模型
在文档处理中,特别是在视觉丰富的文档中,高效信息提取的需求变得越来越关键。VRDs,如发票、水电费单和保险报价,在业务工作流中随处可见,通常以不同的布局和格式呈现类似信息。他们的研究为使普通用户能够访问先进的文档处理功能铺平了道路,标志着该领域迈出了重要的一步。
AITalk官网体验入口 AI语言学习助手口语练习app免费下载地址
AITalk是什么?AITalk是一款语言学习应用,提供AI助手进行口语练习,帮助用户快速提高语言流利度的工具。用户可以自由选择话题进行对话练习,帮助提高口语表达能力。
新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法
研究人员从清华大学和北京理工大学开发了DRAGIN,这是一种针对大型语言模型设计的动态检索增强生成框架。该框架旨在通过在文本生成过程中实时确定何时以及如何检索外部信息,从提高语言模型的性能。未来的工作旨在克服与自注意力可访问性相关的限制,并对查询构建技术的影响进行评估。
Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型
中国香港中文大学和SmartMore的研究人员推出了一种名为Mini-Gemini的新颖框架,通过增强多模态输入处理来推动VLMs的发展。Mini-Gemini采用了双编码器系统和一种新颖的补丁信息挖掘技术,结合一个特别策划的高质量数据集,使其能够有效处理高分辨率图像并生成内容丰富的视觉和文本内容,从使其脱颖出。正如研究人员所承认的那样,Mini-Gemini在视觉理解和推理能力方面仍有改进�
OpenUI官网体验入口 AI自然语言UI设计可视化工具使用地址
OpenUI是一款旨在使UI设计及构建UI组件过程变得有趣、快捷和灵活的工具。OpenUI可用于测试和原型化下一代工具,在LLM的基础上构建强大的应用程序。欲了解更多详情,请访问OpenUI官方网站。
Hume AI EVI对话人工智能体验入口 情感大语言模型eLLM使用地址
Hume.AI专注于开发能够理解人类情感和表情的技术,提供表情测量API和自定义模型API,以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI,采用了情感大语言模型技术。如果您是研究人员、开发者或企业,不妨尝试Hume.AI提供的技术,探索其在情感计算领域的应用和潜力。
AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画
AlComicFactory是一个独特的项目,它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术,它们共同工作,根据用户提供的简单文本提示,自动创建出包含人物对话和场景描述的漫画。无论你是漫画创作者是只是想为你的创意添加视觉元素,AlComicFactory都能为你提供帮助。