谷歌内部推出AI大语言模型Goose 主打代码编写、产品研发
据BusinessInsider报道,近日,谷歌内部秘密开发了一款名为“Goose”的人工智能大语言模型,据知情人士透露。这款AI工具被特别设计给谷歌工程师使用,融入了公司25年的技术积淀,目的是大幅度提高内部团队的工作效能,特别是在代码编写和新产品研发方面。借助深度学习和自然语言处理技术,Goose能够深刻理解工程师的需求,并精准地转化为实际可行的代码解决方案,实现了人机协作的新境界。
麻省理工学院推GenSim项目:利用大语言模型编写机器人新任务
你可能听说过“经验是最好的老师”,但如果在现实世界中学习成本太高怎么办?这是训练机器人进行操纵任务的机器人学家所面临的困境。由于真实世界的互动数据昂贵,他们的机器人通常通过不同活动的模拟版本进行学习。GenSim为LLMs在构思新型机器人活动方面展示了令人鼓舞的未来。
vivo自研蓝河操作系统亮相:全球首款基于Rust语言编写
今日晚间,vivo举行X100系列新品发布会,会上,vivo自主研发的蓝河操作系统”再次亮相。蓝河操作系统是行业首个系统框架由Rust语言编写的操作系统,能够从原点识别内存使用不当导致的安全漏洞。vivoWatch3将首发搭载蓝河操作系统。
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
【新智元导读】AI在学会工作之后,终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理,能够在多种视频游戏设置中执行任务,未来甚至可能可以与任何虚拟环境进行互动。谷歌DeepMind在AI和游戏方面有着悠久的历史。SIMA只是刚刚开始,我们可以期待在更多的训练环境中继续建立SIMA,并整合更有能力的模型,让它变得更具泛化性和多功能性不仅仅局限于游戏。
LARP:开放世界游戏的语言代理角色扮演
LARP是一个开创性的框架,旨在增强用户和语言代理在开放世界游戏中的交互。LARP框架包括了一个涵盖记忆处理和决策辅助功能的认知架构,一个具有反馈驱动可学习行动空间的环境交互模块,以及促进各种个性对齐的后处理方法。其模拟个性和适应动态环境的能力使其成为一个在多个领域具有潜在应用的多功能工具。
多模态语言模型Reka Core:可分析图片、视频、音频 评测得分与GPT-4接近
RekaAI近日宣布推出其最新力作——RekaCore,这是一款前沿的多模态语言模型,拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频,评测得分与GPT-4和Gemini-Ultra接近。通过Edge、Flash和Core等系列模型的全面支持,Reka已经准备好迎接更广泛的挑战,展望未来,我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。
更小更强大!Hugging Face发布8B开源视觉语言模型Idefics2
HuggingFace首次发布了其Idefics视觉语言模型,该模型于2023年首次亮相,采用了最初由DeepMind开发的技术。Idefics迎来了升级,新版本Idefics2拥有更小的参数规模、开放许可证以及改进的光学字符识别能力。Idefics2的发布是AI繁荣持续推出的许多多模态模型之一,包括Reka的新Core模型、xAI的Grok-1.5V和Google的Imagen2。
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2不再依赖庞大的GPT-2库。他本人预告,即将上线新课。等着这一切完成之后,另一期「从头开始构建」的视频也会上线。
AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画
AlComicFactory是一个独特的项目,它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术,它们共同工作,根据用户提供的简单文本提示,自动创建出包含人物对话和场景描述的漫画。无论你是漫画创作者是只是想为你的创意添加视觉元素,AlComicFactory都能为你提供帮助。
谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升
在最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理过程。通过引入轻量级预训练评分器Cappy,这项研究解决了在多任务场景中有效利用大型语言模型的挑战,展示了其在各种任务上的参数效率和性能的优越性,同时强调了在实际应用中简化大型语言模型采用的潜力。
LLM Pricing官网体验入口 大型语言模型定价比较工具在线使用地址
LLMPricing是一个聚合并比较各种大型语言模型定价信息的网站,这些模型由官方AI提供商和云服务供应商提供。用户可以在这里找到最适合其项目的语言模型定价。点击前往LLMPricing官网体验入口需求人群:适用于需要选择合适的大型语言模型进行项目开发的企业和开发者,帮助他们根据成本效益做出决策。
企业级语言模型Command-R发布:专注RAG和工具使用 支持长达128k的上下文
Cohere团队于2024年3月11日发布了Command-R,一款旨在实现生产规模人工智能的新型检索增强生成模型。该模型专注于检索增强生成和工具使用,是可扩展的生成模型,旨在帮助企业从概念验证迈向实际生产。期待用户对Command-R的反馈,并期待在未来提供更多可扩展的模型,助力企业成功迈向生产规模的人工智能应用。
Cohere发布强大的“Command-R”企业级语言模型
人工智能创业公司Cohere今天宣布推出一款名为Command-R的重大新语言模型,该公司总部位于多伦多,正处于一场可能带来高达10亿美元新资本的激烈融资轮中。Cohere的Command-R代表了该公司技术的重大飞跃,为其提供了在关键人工智能任务上的卓越性能。看起来Command-R这样的可扩展类别的人工智能模型非常重要,可以以高效处理重负荷的方式提供实际结果。
Vocalo.ai官网体验入口 语言学习AI平台使用方法教程指南
Vocalo.ai是一个AI驱动的语言学习平台,专注于通过真实的对话体验和即时反馈提高英语口语技能。它模仿真实对话,提供即时反馈,帮助用户在任何时间、任何地点练习英语口语。语言学习AI平台的特色功能AI驱动的英语口语练习即时反馈和语言纠正随时随地的可访问性支持多种语言要了解更多关于Vocalo.ai的信息和开始英语口语学习之旅,请访问官方网站。
第二代Ameca来了!和观众对答如流,面部表情更逼真,会说几十种语言
全新升级的第二代Ameca来了,GPT-4加持,能够实时对答。人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。Ameca还是一个多才多艺的机器人,能够流畅地画出一只猫。
苹果研究人员提出MAD-Bench基准,克服多模态大语言模型中幻觉和误导性提示
在人工智能领域,多模式大语言模型在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。这种脆弱性引发了对MLLM在需要准确解释文本和视觉数据的应用中可靠性的担忧。作为一个不断发展的领域,解决这些挑战对于在现实应用中部署MLLMs至关重要。
斯坦福大学研究人员发布新机器学习方法C3PO:根据上下文定制大型语言模型
斯坦福大学的研究人员最近发布了一种名为C3PO的新方法,旨在解决语言模型定制化面临的挑战。在人工智能领域不断发展的今天,语言模型的定制化对于确保用户满意度至关重要。这项研究的意义超出了技术成就的范畴,预示着人工智能可以无缝适应个人偏好、增强其实用性和可访问性的未来。
ChatMusician:一个融合了音乐天赋的开源大语言模型
ChatMusician是一个基于开源大语言模型的项目,它通过与文本兼容的音乐符号系统ABC记谱法,使LLaMA2模型能够理解和创作音乐。这意味着模型可以独立地使用纯文本来处理音乐,无需依赖外部的多模态神经网络结构或特殊的词法分析器。其开创性的方法为音乐和语言之间的交叉研究提供了有益的范例,展示了人工智能在创意领域的巨大潜力。
ChatMusician官网体验入口 AI音乐生成语言模型在线使用地址
ChatMusician是一个开源的大型语言模型,它通过持续的预训练和微调,集成了音乐能力。该模型基于文本兼容的音乐表示法,将音乐视为第二语言。ChatMusician能够在不依赖外部多模态神经结构或分词器的情况下,理解和生成音乐。
谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型
划重点:⭐️GoogleAI团队提出了ScreenAI,这是一个视觉语言模型,可以全面理解UI和信息图。⭐️ScreenAI在多个任务上表现出色,包括图形问答,元素注释,摘要生成等。通过利用这些组件的共同视觉语言和复杂设计,ScreenAI为理解数字内容提供了全面的方法。