别质疑!余承东:鸿蒙是真正的操作系统 从编程语言到编译器全栈华为自研
在今天的发布会上,华为官方正式宣布,鸿蒙系统是真正意义上的操作系统。余承东在发布会上表示,鸿蒙系统真正拥有了底座”,全栈自研技术已全面落地,鸿蒙内核已经超越传统内核”,更适应全场景设备多样化。随后有博主直言,这个问题周鸿祎现场也问了,鸿蒙确实没用linux,所以丝毫不用担心余承东说法的准确性。
开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练
开源人工智能平台LightningAI宣布与Nvidia合作,发布了名为“Thunder”的下一代AI编译器,旨在加速人工智能模型的训练速度。据LightningAI称,该编译器在实际场景中相比未优化的代码,可将大型语言模型的训练速度提高高达40%。LightningStudios的产品可以按四个定价级别购买:个人开发者免费,工程师、研究人员和科学家专业级;初创公司和团队的团队级别,以及大型组织的企业级别。
多模态语言模型Reka Core:可分析图片、视频、音频 评测得分与GPT-4接近
RekaAI近日宣布推出其最新力作——RekaCore,这是一款前沿的多模态语言模型,拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频,评测得分与GPT-4和Gemini-Ultra接近。通过Edge、Flash和Core等系列模型的全面支持,Reka已经准备好迎接更广泛的挑战,展望未来,我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。
更小更强大!Hugging Face发布8B开源视觉语言模型Idefics2
HuggingFace首次发布了其Idefics视觉语言模型,该模型于2023年首次亮相,采用了最初由DeepMind开发的技术。Idefics迎来了升级,新版本Idefics2拥有更小的参数规模、开放许可证以及改进的光学字符识别能力。Idefics2的发布是AI繁荣持续推出的许多多模态模型之一,包括Reka的新Core模型、xAI的Grok-1.5V和Google的Imagen2。
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2不再依赖庞大的GPT-2库。他本人预告,即将上线新课。等着这一切完成之后,另一期「从头开始构建」的视频也会上线。
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
【新智元导读】AI在学会工作之后,终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理,能够在多种视频游戏设置中执行任务,未来甚至可能可以与任何虚拟环境进行互动。谷歌DeepMind在AI和游戏方面有着悠久的历史。SIMA只是刚刚开始,我们可以期待在更多的训练环境中继续建立SIMA,并整合更有能力的模型,让它变得更具泛化性和多功能性不仅仅局限于游戏。
AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画
AlComicFactory是一个独特的项目,它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术,它们共同工作,根据用户提供的简单文本提示,自动创建出包含人物对话和场景描述的漫画。无论你是漫画创作者是只是想为你的创意添加视觉元素,AlComicFactory都能为你提供帮助。
谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升
在最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理过程。通过引入轻量级预训练评分器Cappy,这项研究解决了在多任务场景中有效利用大型语言模型的挑战,展示了其在各种任务上的参数效率和性能的优越性,同时强调了在实际应用中简化大型语言模型采用的潜力。
LLM Pricing官网体验入口 大型语言模型定价比较工具在线使用地址
LLMPricing是一个聚合并比较各种大型语言模型定价信息的网站,这些模型由官方AI提供商和云服务供应商提供。用户可以在这里找到最适合其项目的语言模型定价。点击前往LLMPricing官网体验入口需求人群:适用于需要选择合适的大型语言模型进行项目开发的企业和开发者,帮助他们根据成本效益做出决策。
企业级语言模型Command-R发布:专注RAG和工具使用 支持长达128k的上下文
Cohere团队于2024年3月11日发布了Command-R,一款旨在实现生产规模人工智能的新型检索增强生成模型。该模型专注于检索增强生成和工具使用,是可扩展的生成模型,旨在帮助企业从概念验证迈向实际生产。期待用户对Command-R的反馈,并期待在未来提供更多可扩展的模型,助力企业成功迈向生产规模的人工智能应用。
Cohere发布强大的“Command-R”企业级语言模型
人工智能创业公司Cohere今天宣布推出一款名为Command-R的重大新语言模型,该公司总部位于多伦多,正处于一场可能带来高达10亿美元新资本的激烈融资轮中。Cohere的Command-R代表了该公司技术的重大飞跃,为其提供了在关键人工智能任务上的卓越性能。看起来Command-R这样的可扩展类别的人工智能模型非常重要,可以以高效处理重负荷的方式提供实际结果。
Vocalo.ai官网体验入口 语言学习AI平台使用方法教程指南
Vocalo.ai是一个AI驱动的语言学习平台,专注于通过真实的对话体验和即时反馈提高英语口语技能。它模仿真实对话,提供即时反馈,帮助用户在任何时间、任何地点练习英语口语。语言学习AI平台的特色功能AI驱动的英语口语练习即时反馈和语言纠正随时随地的可访问性支持多种语言要了解更多关于Vocalo.ai的信息和开始英语口语学习之旅,请访问官方网站。
第二代Ameca来了!和观众对答如流,面部表情更逼真,会说几十种语言
全新升级的第二代Ameca来了,GPT-4加持,能够实时对答。人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。Ameca还是一个多才多艺的机器人,能够流畅地画出一只猫。
苹果研究人员提出MAD-Bench基准,克服多模态大语言模型中幻觉和误导性提示
在人工智能领域,多模式大语言模型在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。这种脆弱性引发了对MLLM在需要准确解释文本和视觉数据的应用中可靠性的担忧。作为一个不断发展的领域,解决这些挑战对于在现实应用中部署MLLMs至关重要。
斯坦福大学研究人员发布新机器学习方法C3PO:根据上下文定制大型语言模型
斯坦福大学的研究人员最近发布了一种名为C3PO的新方法,旨在解决语言模型定制化面临的挑战。在人工智能领域不断发展的今天,语言模型的定制化对于确保用户满意度至关重要。这项研究的意义超出了技术成就的范畴,预示着人工智能可以无缝适应个人偏好、增强其实用性和可访问性的未来。
ChatMusician:一个融合了音乐天赋的开源大语言模型
ChatMusician是一个基于开源大语言模型的项目,它通过与文本兼容的音乐符号系统ABC记谱法,使LLaMA2模型能够理解和创作音乐。这意味着模型可以独立地使用纯文本来处理音乐,无需依赖外部的多模态神经网络结构或特殊的词法分析器。其开创性的方法为音乐和语言之间的交叉研究提供了有益的范例,展示了人工智能在创意领域的巨大潜力。
ChatMusician官网体验入口 AI音乐生成语言模型在线使用地址
ChatMusician是一个开源的大型语言模型,它通过持续的预训练和微调,集成了音乐能力。该模型基于文本兼容的音乐表示法,将音乐视为第二语言。ChatMusician能够在不依赖外部多模态神经结构或分词器的情况下,理解和生成音乐。
谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型
划重点:⭐️GoogleAI团队提出了ScreenAI,这是一个视觉语言模型,可以全面理解UI和信息图。⭐️ScreenAI在多个任务上表现出色,包括图形问答,元素注释,摘要生成等。通过利用这些组件的共同视觉语言和复杂设计,ScreenAI为理解数字内容提供了全面的方法。
2024年技术招聘报告出炉,1/5程序员担心失业!Python和JavaScript成最受欢迎编程语言
技术招聘平台CoderPad发布了一份《2024年技术招聘现状》的报告。是CoderPad调研了来自全球149个不同国家/地区的13000多名开发者,和143个国家的5500名HR之后做出来的。人工智能专家的岗位第一次进入了最难招聘岗位的前三名,直接把多年位居榜首的全栈工程师赶到了第三名。
通过纠正检索增强生成 (CRAG) 提高大语言模型的准确性
在自然语言处理中,追求语言模型精度的过程中,创新的方法不断涌现,以缓解这些模型可能存在的固有不准确性。其中一个显著的挑战是模型倾向于产生“幻觉”或事实错误,因为它们依赖内部知识库。这一进展承诺提升LLMs在从自动化内容创建到复杂对话代理等应用中的效用,为语言模型可靠地反映人类知识的丰富性和准确性铺平了道路。