开源大模型DBRX:1320亿参数,比Llama2-70B快1倍
大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。根据Databricks公布的协议,基于DBRX打造的产品,如果月活超过7亿,就必须另行向Databricks提交申请。
1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX
3月28日,著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。Databricks主要提数据智能分析服务,帮助企业、个人用户快速挖掘数据的商业价值。
今日AI:Sora超现实大片震惊好莱坞;IPadapter插件史诗级更新;苹果要推AI应用商店;DALL-E也推局部重绘功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
DALL-E将推图片编辑功能 生成图像可局部重绘
DALL-E即将推出图片的编辑功能,类似于局部重绘。这意味着用户可以通过画笔涂抹指定区域,然后对该区域进行重绘。这一功能不仅可以帮助用户修正图像中的错误可以添加新元素或改变图像的风格。
Jan:全平台的本地LLM聊天软件
在人工智能领域,一款名为Jan的全平台本地LLM聊天软件引起了人们的关注。这款软件的主要特点是支持自动下载模型以及提供非常详细的设置选项,为用户提供了极大的便利性。我们期待Jan在未来能够带来更多的便利和创新。
微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本
微软研究发布了名为LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从降低成本和延迟。该公司认为这是一个有前途的方法,可以通过压缩提示实现更好的泛化能力和效率。
MedChatZH:一款专为传统中医会诊设计的调校LLM模型
GenerativeLargeLanguageModels在各种自然语言处理任务中取得了显著成功,包括问答和对话系统。大多数模型是在英文数据上训练的,缺乏在提供中文答案方面的强大泛化能力。MedChatZH的有效性有望为特定于不同语言和文化背景的LLMs开辟新途径。
LLM4Decompile官网体验入口 AI代码反编译工具免费使用下载地址
LLM4Decompile是一个开源项目,旨在创建并发布第一个专门用于反编译的LLM,并通过构建首个专注于可重编译性和可执行性的反编译基准测试来评估其能力。该项目通过编译大量C代码样本到汇编代码,然后使用这些数据对DeepSeek-Coder模型进行微调,构建了评估基准Decompile-Eval。要了解更多信息并开始使用LLM4Decompile,请访问LLM4Decompile官方网站。
GenAudit:帮用户根据输入证据对LLM生成内容进行事实检查
随着人工智能和主要是生成式AI领域的进展,已经展示了大型语言模型生成文本以响应输入或提示的能力。这些模型能够像人类一样生成文本,回答问题,总结长篇文本段落等。GENAUDIT是一款优秀的工具,有助于改善具有强大文档基础的任务中的事实核查程序,并提高LLM生成的信息在重要应用中的可靠性。
大模型“路由器”OpenRouter 为LLM何其他AI模型提供统一接口
OpenRouter是一个创新性的项目,它为大语言模型和其他AI模型提供了一个统一的接口。通过这个接口,用户可以直接访问和使用几十种AI模型,包括GPT、LLama、Claude、Command-R等80多个模型,未来还将扩展到数百种。AI角色聊天和故事,更好的ChatGPT用户界面等功能,为用户带来全新的AI体验。
LLM Pricing官网体验入口 大型语言模型定价比较工具在线使用地址
LLMPricing是一个聚合并比较各种大型语言模型定价信息的网站,这些模型由官方AI提供商和云服务供应商提供。用户可以在这里找到最适合其项目的语言模型定价。点击前往LLMPricing官网体验入口需求人群:适用于需要选择合适的大型语言模型进行项目开发的企业和开发者,帮助他们根据成本效益做出决策。
奔驰汽车工厂引入Apollo机器人:主要承担繁重体力活
德国车企梅赛德斯-奔驰与机器人初创企业Apptronik合作,使用人型机器人阿波罗”将进入奔驰的汽车生产线。目前阿波罗”在奔驰工厂里的主要作用,是从事搬运、装配等繁重体力活,将汽车零部件搬运到生产线上供工人进行组装,同时检查这些零部件。Apptronik的联合创始人兼CEOJeffCardenas表示,梅赛德斯计划利用机器人技术和阿波罗”来自动化一些低技能、体力挑战大的劳务工作,这是一个典型的应用案例,我们有望在未来几个月和几年内看到其他组织效仿。
Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI
【新智元导读】LLM开源从Infra做起!Meta公布了自己训练Llama3的H100集群细节,看来Llama3快来了。每年3月份,照例各家大厂又要开始秀自己最新的产品和研究了。Meta的目标是创建灵活可靠的系统,以支持快速发展的新模式和研究。
Follow-Your-Click怎么使用?Follow-Your-Click官网地址入口
Follow-Your-Click是一款通过简短提示制作开放领域区域图像动画的工具。用户可以点击参与动画生成,并可观看和比较不同生成方法和效果。用户可以了解消融研究结果,比较不同方法所带来的效果差异。
图像新技术Follow-Your-Click:用户指哪动哪
Follow-Your-Click是一个能够根据用户的点击和提示,使图像特定区域动起来的新技术。该项目由香港科技大学、腾讯、清华大学的研究者共同开发。用户可以通过简单的点击和短语提示轻松地指定希望动画化的区域和动作类型,无需复杂的操作或详细描述。
Hello8官网体验入口 AI视频翻译工具免费在线使用地址
Hello8是一款视频翻译工具,能够将视频内容快速翻译成29种以上语言,以便触达全球受众。使用Hello8可以帮助内容创作者、营销人员、代理商和在线教师将视频内容本地化并扩大影响力。希望通过Hello8这款便捷的视频翻译工具,您可以将您的视频内容推广至更广泛的受众群体中。
给大模型补脑?腾讯发布ELLA,让SD模型提示词理解能力更强
腾讯昨天发布了一个名为ELLA的项目,这是一个高效的大语言模型适配器,能够无需训练就增强现有SD模型提示词理解的能力。ELLA将强大的大语言模型整合到文本到图像的扩散模型中,从显著提升模型处理文本对齐的能力不需要额外对U-Net或大语言模型进行训练。这个项目的发布为文本到图像模型的发展带来了新的可能性,也为未来的研究和应用提供了新的思路。
Sora计划在今年内发布 将采用与Dall-E类似的内容过滤策略
Sora计划在今年内发布。Sora将推出一种全新的视频生成技术,能够在短短几分钟内生成一段20秒的720p视频不需要花费几个小时的时间。这将推动机器人技术的发展,开辟新的应用领域。
ShellGPT官网体验入口 AI命令行工具应用软件下载地址
ShellGPT是一个利用AI大型语言模型的强大能力,通过命令行界面提供辅助的工具,使用户能够通过自然语言指令来执行任务,提高工作效率和效率。需求人群主要适用于开发者和高级用户,特别是那些希望在命令行环境中利用AI提高生产力的用户。如果您是开发者或高级用户,快来体验这款功能强大的命令行工具吧!
Llama-3公布基础训练设施,使用49,000个H100
3月13日,社交、科技巨头Meta在官网公布了两个全新的24KH100GPU集群,专门用于训练大模型Llama-3。Llama-3使用了RoCEv2网络,基于Tectonic/Hammerspace的NFS/FUSE网络存储,继续使用了PyTorch机器学习库。将Meta的Tectonic分布式存储解决方案和Hammerspace结合在一起,可以在不影响规模的情况下实现快速功能迭代。