Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
【新智元导读】Claude3在通用任务上是全球最强已经毋庸置疑。更令人惊叹的是,它在专业领域的表现,比如化学任务,也能远远领先GPT-4。可以预想到,作为通用模型来设计的LLM,会在专业领域逐渐爆发。
GPT-4在医学问题上击败了专业调优的 MedPaLM 2 模型
微软的研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径。选择使用通用基础模型仍然涉及到多方面的考虑,包括数据隐私、安全性、成本和竞争优势等因素。