击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
OpenAI给广大用户发放福利,在下场修复GPT-4变懒的问题后顺道上新了5个新模型,其中就包括更小且高效的text-embedding-3-small嵌入模型。嵌入是表示自然语言或代码等内容中概念的数字序列。要获得访问权限,用户需要先创建NomicAtlas帐户并按照contrastors存储库中的说明进行操作。
五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈
在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在AI大模型领域,Transformer架构不能这么形容,因为它几乎撑起了「整个江山」。与类似规模的Transformer相比,Mamba具有5倍的生成吞吐量Mamba-3B的质量与两倍于其规模的Transformer相当。
Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型
JinaAI公布了其第二代文本嵌入模型的最新进展:jina-embeddings-v2。这个最先进的模型是唯一支持8K上下文长度的开源解决方案。认识到人工智能社区的不同需求,JinaAI提出了这两种不同的模型选项,允许用户选择最适合其计算需求并符合其应用偏好的模型。