百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于1月29日推出了拥有超过千亿参数的大型语言模型Baichuan3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT-4的水平。Baichuan3全面的通用能力以及在医疗领域的强大表现,将为百川智能打造“超级应用”,把大模型技术落地到诸多复杂应用场景提供有力支撑。
SuperCLUE:GPT-4 Turbo中文基准评测领先国内最强模型超过30分
GPT-4Turbo是OpenAI发布的最新ChatGPT模型,具有128K上下文和训练数据知识截止至2023年4月。SuperCLUE表示,GPT-4Turbo在SuperCLUE-OPEN中文通用大模型综合性评测基准上,取得了总分98.4,八项基础能力满分,领先国内最强模型超过30分。5.GPT-4Turbo对函数调用、指令和JSON模式进行了调优,提高了模型的性能。