研究发现:GPT-4在临床推理中表现优于医生,但也更经常出错
在一项新研究中,美国贝斯以色列医疗中心的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的IDEA评分,这是一种常用工具,用于评估临床推理能力。尽管这些AI系统还没有准备好用于临床诊断,但仍可能利用这项技术来增强临床工作流程,特别是在保持人类控制的同时确保安全、准确的过程。
女子快递收到价值657万的13kg金条:一个环节出错
天降横财,换做你会怎么做?近日在福建福州,一女子在上班期间突然收到了一份快递,她并不记得自己买了什么,打开之后直接懵了,因为里面竟然有整整260根亮闪闪的金条,总重13公斤,按最新金价计算,这些金条总价超过了657万!还有网友表示,如今监控这么普遍很容易追踪溯源,想要昧下这笔横财也不是易事,拒不归还怕是要承担法律责任,所以即便有二心,也不可敢这么做。
研究发现:GPT-3经常出错,重复有害的错误信息
一项新研究发现,OpenAI的ChatGPT等大型语言模型经常重复阴谋论、有害的刻板印象和其他形式的错误信息。图源备注:图片由AI生成,图片授权服务商Midjourney最近的一项研究中,加拿大滑铁卢大学的研究人员系统地测试了ChatGPT对六个类别的声明的理解。”研究中,研究人员使用了四种不同的调查模板,询问了超过1200个不同的陈述,涵盖了六个类别的事实和错误信息。
GPT-4作弊被抓,吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试
GPT-4解决网络名梗“吉娃娃or蓝莓松饼”,一度惊艳无数人。现在它被指出“作弊”了!全用原题中出现的图,只是打乱顺序和排列方式。比如GPT-4V能正确数出七个小矮人白雪公主,却把七个葫芦娃数成了10个。
南航客服回应机票低至10元 系统出错了
2023年11月8日晚,多名消费者反映南方航空成都进出港航线的机票价格低至10元、20元、30元不等。这些超低价机票不仅在南方航空App上可以购买能在多家在线旅游平台抢购到。对于后续是否会有相应的通知,该客服表示尚不确定,建议旅客留意或询问客服。