网易给年轻人做了个「电子烟花」
我知道我们已经聊过不少次《蛋仔派对》(下称蛋仔),但最近,我发现一件听上去很离谱的事:对不少年轻人来说,这款产品已经成了他们「赖以生存」的「精神乐园」。就拿跨年夜那天晚上的活动来说,当晚有很多玩家一直守在游戏里、全程录屏,和他们的蛋搭子相约在零点合影,甚至还有人说这是他见过「游戏中最震撼的跨年秀」:不管是游戏中颇有创意的灯光秀表演、巨
接口终于统一!欧盟宣布:明年起所有电子设备全部采用USB-C
漫长的等待终于结束了。”日前欧盟委员会正式宣布,从2024年起,USB-C将成为欧盟电子设备的通用标准。USB-C接口一统天下,尘埃落定。
百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于1月29日推出了拥有超过千亿参数的大型语言模型Baichuan3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT-4的水平。Baichuan3全面的通用能力以及在医疗领域的强大表现,将为百川智能打造“超级应用”,把大模型技术落地到诸多复杂应用场景提供有力支撑。
通义千问72B模型荣登大模型评测平台OpenCompass榜首
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。通义千问-72B可以处理最长为32k的文本输入,并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。AlignBench的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答案生成和难度筛选等步骤,确保具有真实性和挑战性。通过登录AlignBench网站,提交结果可以使用CritiqueLLM作为评分模型进行评测,大约5分钟即可得到评测结果。
SuperCLUE:GPT-4 Turbo中文基准评测领先国内最强模型超过30分
GPT-4Turbo是OpenAI发布的最新ChatGPT模型,具有128K上下文和训练数据知识截止至2023年4月。SuperCLUE表示,GPT-4Turbo在SuperCLUE-OPEN中文通用大模型综合性评测基准上,取得了总分98.4,八项基础能力满分,领先国内最强模型超过30分。5.GPT-4Turbo对函数调用、指令和JSON模式进行了调优,提高了模型的性能。