今日AI:OpenAI要给开发者发钱;马斯克Grok-1.5王炸级更新;李玟姐姐称AI“复活”是二次伤害;世界首个Mamba的生产级模型Jamba发布
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX
3月28日,著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。Databricks主要提数据智能分析服务,帮助企业、个人用户快速挖掘数据的商业价值。
马斯克本周将开源类ChatGPT产品Grok,性能超越GPT-3.5和LLaMA270B
马斯克宣布将在本周开源由xAI旗下公司推出的生成式AI产品——Grok。这款类ChatGPT产品于去年11月首次亮相,针对生成文本、代码、邮件和信息检索等多个领域提供功能。以上内容参考xAI官网,如有侵权请联系删除。
英伟达发布Nemotron-4 15B: 8 万亿训练数据,性能超LLaMA-2
英伟达最新推出的大型语言模型Nemotron-415B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,基于庞大的8万亿文本标注数据进行了预训练。这一成就为大型语言模型的发展和应用提供了崭新的视角。
亚马逊云宣布Mistral AI 模型即将登陆 Amazon Bedrock
MistralAI是一家总部位于法国的人工智能公司,专注于将公开可用的模型提升至最先进的性能水平。他们主要致力于构建快速安全的大型语言模型,可用于各种任务,如聊天机器人和代码生成。MistralAI模型具有以下优势:MistralAI的模型即将登陆AmazonBedrock,让用户能够更灵活地选择最适合其需求的高性能基础模型,构建并扩展生成式AI应用程序。
Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元
Groq公司推出了一款号称性价比高达英伟达GPU100倍的AI推理芯片,引起了广泛关注。运行其最快AI推理芯片LIama2所需的成本高达1171万美元,让业内人士开始对其效益进行热议。Groq推出的AI推理芯片在性能上取得了突破,但成本问题仍需解决。
AI视野:Meta发布Code Llama70B;Nijijourney V6模型正式上线;Chrome将内置AI写作助手;Minimax的AI对话机器人海螺问问上线
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
报道称iPhone设计师加入LoveFrom,将与Sam Altman合作开发新AI硬件
iPhone首席设计师唐探已加入JonyIve的LoveFrom,并与OpenAI首席执行官SamAltman合作开发一款专注于AI的全新设备。Tan也是AppleWatch的设计负责人之一,目前苹果公司还没有人任命他的继任者。LoveFrom目前正在讨论和集思广益的概念包括家用设备,可能类似于HomePod,但细节再次没有透露,LoveFrom和苹果拒绝对最近的事件和谣言发表评论。
微软宣布 Sam Altman 和 Greg Brockman 加盟,领导新的高级 AI 研究团队
微软公司的首席执行官SatyaNadella在周一表示,SamAltman、GregBrockman以及他们的许多前OpenAI同事将加入这家软件巨头。这一宣布标志着在AI初创公司的高管突然离职后,经过三天激烈讨论的高潮。Nadella似乎还证实了EmmettShear被任命为OpenAI新任首席执行官的报道,称他们「期待着了解EmmettShear和OpenAI的新领导团队,并与他们合作」。
复旦研究团队揭示RoPE位置编码微调法则 LLaMA2上下文长度暴涨至100万tokens
复旦大学和上海人工智能实验室的研究团队在一项新研究中,揭示了一项引人注目的发现:他们能够通过微调一个关键的RoPE位置编码中的超参数,显著扩展大型模型的上下文长度,从1.6万tokens延长至100万tokens,同时提升外推能力。这个超参数被称为旋转角底数,在RoPE位置编码中起着关键作用。这一规律的发现将有望进一步改善大型模型在自然语言处理等领域的性能,并提供更多应用潜力。
Llama 3突然来袭!开源社区再次沸腾:GPT-4级别模型可以自由访问的时代到来
Llama3来了!就在刚刚,Meta官网上新,官宣了Llama380亿和700亿参数版本。并且推出即为开源SOTA:Meta官方数据显示,Llama38B和70B版本在各自参数规模上超越一众对手。好在乌龙完了,官方也没拖着,关心开源大模型的小伙伴们,可以造作起来了。
百度智能云宣布支持Llama3全系列训练推理
4月19日,百度智能云千帆大模型平台在国内首家推出针对Llama3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型,现已开放邀约测试。百度智能云千帆大模型平台中各种尺寸模型定制工具ModelBuilder已预置了最全面最丰富的大模型,支持国内外第三方主流模型,总数量达到79个,是国内拥有大模型数量最多的开发平台。4月18日,Meta正式发布Llama3,包括8B和70B参数的大模型,官方号称有史以来最强大的开源大模型。
最强大模型Llama 3正式发布 已达GPT4级别
Meta公司宣布了一项重大技术进展,发布了其最新的开源模型——Llama3。这一模型包含两种参数规模:8B和70B,预计将于今年7月正式面世。MetaAI还整合了搜索功能,可以直接访问网络上的实时信息,无需切换应用。
Llama 3官网体验入口 Meta最新开源语言模型免费使用地址
MetaLlama3是Meta公司最新推出的一款开源大型语言模型。它在多项行业基准测试中表现出色,性能卓越,可支持广泛的使用场景,包括改善推理能力等新功能。要了解更多信息,请访问MetaLlama3官方网站。
Ollama更新 优化软件并支持Command R+等多个热门模型
Ollama软件的最新更新为用户带来了一系列显著的性能提升和新功能。这次更新主要集中在优化软件性能,提高VRAM的利用率,减少内存不足的错误,并改善GPU的运行效率。无论是研究人员、开发者还是普通用户,都能够从Ollama的新功能和模型支持中受益。
性能超越LLaMA2-7B!AI模型JetMoE-8B训练成本不到10万美元
JetMoE-8B是一款采用稀疏激活架构的人工智能模型,其性能卓越且训练成本不到10万美元,令人惊讶的是,它的表现甚至超越了LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B。JetMoE-8B由24个块组成,每个块包含两个MoE层:注意力头混合和MLP专家混合。这不仅证明了其在性能上的优势,也展示了其在成本效益上的显著优势。
英特尔Battlemage显卡即将亮相 力争在假日季与Nvidia和AMD竞争
英特尔正在积极推进其下一代Battlemage系列专用显卡的开发,希望能够在今年年底前推出新品。英特尔计划在2023年黑色星期五前发布Battlemage显卡,以在假日购物季与Nvidia和AMD的新一代显卡产品展开竞争。消费者有望在假日购物季获得更多优质的显卡选择。
Meta计划下周推Llama3基础版,夏季推出全面版
Meta计划在下周预演其大型语言模型Llama3的两个基础版本。Llama3预计将支持多模态功能,允许用户输入文本和图像予以回应。预计将Meta在全球夏季推出完整的Llama3模型。
OpenAI创始人Sam Altman入选福布斯亿万富翁榜单
福布斯周一表示,ChatGPT创造者OpenAI的CEOSamAltman已成为亿万富翁。Altman自2022年以来成为全球人工智能热潮的代表人物,当他的公司推出ChatGPT时,他在《福布斯》杂志的亿万富翁榜单中名列第2692位。泰勒・斯威夫特也正式入选《福布斯》亿万富翁榜单,估计财富为11亿美元。
Meta即将推出新一代Llama3大语言模型
MetaPlatforms公司计划在下周推出Llama3大语言模型的两个小参数版本,作为即将在2024年夏天推出的Llama3最大版本的前奏。Llama3最高版本可能拥有超过1400亿个参数,这将使其性能有望赶上OpenAI最新的GPT-4Turbo版本。Meta正在全力推进Llama3的开发,这不仅体现了该公司在AI领域的野心,也为用户带来了更加智能和开放的AI服务的期待。