Patronus AI发现领先AI系统存在“令人担忧”的安全漏洞
PatronusAI,一家专注于负责任AI部署的初创公司,日前发布了一款名为SimpleSafetyTests的新型诊断测试套件,以帮助识别大型语言模型中的关键安全风险。这一宣布出现在人们对像ChatGPT这样的生成式AI系统在未经妥善保护的情况下可能提供有害响应的担忧不断增长之际。通过基本测试是第一步不是完全生产就绪的证明。
Google 扩展其漏洞奖励计划以增强生成式人工智能系统的安全性
Google宣布,将扩展其漏洞奖励计划,以奖励研究人员寻找针对生成式人工智能系统的攻击方案,以增强AI的安全性和安全性。Google的LaurieRichardson和RoyalHansen表示:「生成式AI带来了与传统数字安全不同的新问题,例如可能存在的不公平偏见、模型操作或数据误解。连同Anthropic和微软宣布了创建一个1000万美元的AI安全基金,专注于推动AI安全领域的研究。