Humane计划于2024年3月发布基ChatGPT可佩戴设备AI Pin
Humane是一家由SamAltman支持的人工智能公司,推出了一款名为AIPin的基于ChatGPT技术的智能设备。该设备于去年11月推出,旨在减少对智能手机的依赖。您还需要良好的互联网连接才能操作AIPin。
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确定的规则评判胜负。正如开发者所说,想要赢,要在速度和精度之间做好权衡。
苹果研究人员提出MAD-Bench基准,克服多模态大语言模型中幻觉和误导性提示
在人工智能领域,多模式大语言模型在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。这种脆弱性引发了对MLLM在需要准确解释文本和视觉数据的应用中可靠性的担忧。作为一个不断发展的领域,解决这些挑战对于在现实应用中部署MLLMs至关重要。