无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用
随着人工智能技术的发展,以GPT-4为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。大模型本身的安全性问题也变得尤为重要。也公开了收集的所有法律准则与道德准则,以及5个测试基准中所使用的所有数据。