逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时,前提信息的呈现顺序对其表现具有决定性影响。在逻辑推理和数学问题中,前提按照逻辑自然顺序排列时,模型表现更佳。在逻辑推理中,前提顺序对大型语言模型推理表现有重大影响,如何应对这一问题仍是一个挑战。
谷歌暂停AI图像生成功能:承认存在技术缺陷
谷歌周五承认,其人工智能工具Gemini在生成历史人物图像时出现错误,导致图像显示出明显的种族偏差。本周早些时候,媒体发现Gemini生成了不同种族的纳粹分子和美国开国元勋的图像。谷歌将继续努力改进人工智能技术,以克服这些挑战。
LeCun曝多模态LLM重大缺陷 提出Interleaved-MoF显著增强视觉理解能力
近期来自纽约大学和UC伯克利的研究团队在多模态大语言模型领域取得了重要突破,成功捕捉到了其在视觉理解方面存在的重大缺陷。研究人员发现,当前的MLLM在特定场景下,甚至在一些人类容易识别的图像问题上,表现不如随机猜测。这不仅对AI领域的研究有着积极的推动作用,也为未来开发更强大、全面的多模态大模型奠定了基础。
DeepMind最新Nature论文被爆重大缺陷 AI没弄出新化合物还弄错成分
谷歌DeepMind团队与其他团队联合发表的一篇论文声称AI可以自主创造合成物,引发了广泛讨论。伦敦大学的一位化学教授发现了这篇论文中严重的缺陷,指出其材料表征存在问题,并建议撤回该论文。这一事件引发了对AI在化学领域应用的讨论,提醒人们在应用AI时要注意其局限性。
AI训练中的缺陷:算法决策或成为未来生活的威胁
近期由多伦多大学和麻省理工学院的计算机科学家团队进行的实验发现,当前AI模型的设计存在严重问题,可能给人类带来灾难性后果。这是因为使用描述性标签训练的AI系统往往做出比人类更为苛刻的决定。在这个算法主导的时代,关键是要及早纠正这一问题,以避免对人类生活造成严重影响。
Disney+电影《舞会契约》中AI演员再次被VFX艺术家批评存在更多缺陷
VFX艺术家对Disney电影《舞会契约》中的AI演员提出更多批评,质疑数字替身的必要性,并暗示可能存在一些掩盖行为。在CorridorCrew的最新视频中,VFX艺术家审视了《舞会契约》中的AI演员,突出了其参与的一些缺陷。随着SAG-AFTRA和AMPTP之间协议的更多信息披露,将会看到人工智能在电影中的使用是否会有所改变。
DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
【新智元导读】DeepMind的研究人员发现,LLM有一个天生的缺陷——在推理过程中无法通过自我纠正获得更好的回复,除非数据集中预设了真值标签。马库斯又高兴地转发了这篇论文。为了公平比较,应在事前和事后提示上投入同等的努力。
GPT-4不知道自己错了! LLM新缺陷曝光,自我纠正成功率仅1%,LeCun马库斯惊呼越改越错
【新智元导读】GPT-4根本不知道自己犯错?最新研究发现,LLM在推理任务中,自我纠正后根本无法挽救性能变差,引AI大佬LeCun马库斯围观。大模型又被爆出重大缺陷,引得LeCun和马库斯两位大佬同时转发关注!在推理实验中,声称可以提高准确性的模型自我纠正,把正确率从16%「提高」到了1%!简单来说,就是LLM在推理任务中,无法通过自我纠正的形式来改进输出,除非LLM在自我纠�
苹果iPhone 15 Pro系列被曝存在设计缺陷:容易误触
在iPhone15Pro和iPhone15ProMax上,苹果对静音拨片进行了重新设计,使其成为一种可自定义操作的按钮。这个新的设计让用户能够通过长按来触发各种功能。通过重新设计静音拨片为可自定义操作按钮,苹果旨在提供更好的用户体验,并解决了一些常见问题。
iPhone屏幕被修复的真实原因找到了:iPhone 12有30%的屏幕有缺陷
苹果公司最近在其iPhone显示屏上蚀刻了条形码,用于精确跟踪供应商丢弃的有缺陷屏幕数量。这些条形码非常小,只有特殊设备才能看到。在苹果公司施加的压力下,供应商将不良率降至十分之一,从节省了数亿美元的费用。