被追问Sora是否使用YouTube数据,OpenAI高管又语塞了
OpenAI的另一位高管在被问及Sora视频生成器是否使用了YouTube数据时,同样陷入了困境。在最近举行的Bloomberg科技峰会上,OpenAI席运营官BradLightcap在回答记者ShirinGhaffary的问题时,以迂回冗长的方式回应,没有给出明确答案。这一事件引发了人们对于AI训练数据的透明度和道德问题的广泛讨论。
OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频
AI公司在获取高质量训练数据方面遇到的挑战,OpenAI为了训练其最先进的大型语言模型GPT-4,使用了超过一百万小时的YouTube视频副本。该公司通过其Whisper音频转录模型转录这些视频,尽管这一做法在法律上具有争议性,OpenAI仍认为这属于合理使用。AI领域正面临训练数据短缺的挑战解决方案尚未明朗,公司们需要权衡利弊并寻求合理途径应对这一问题。
OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4
《华尔街日报》报道称,人工智能公司在收集高质量训练数据方面遇到了困难。《纽约时报》详细介绍了一些公司处理这一问题的方法,其中涉及到了人工智能版权法的模糊灰色区域。但这些公司的另一个选择是使用他们能找到的任何东西,无论他们是否获得许可,这可能会引发版权法方面的担忧。
YouTube新规定要求创作者披露视频中使用AI技术部分
YouTube日前宣布,现要求创作者向观众披露视频内容中使用人工智能技术制作的部分。该平台在CreatorStudio中引入了新的工具,当观众可能误认为视频中的人物、场景或事件是真实的实际上通过AI技术如修改、合成等方式制作时,创作者必须进行标注。YouTube将在各类平台上强制要求使用AI技术部分的视频进行标注,甚至会主动为某些视频添加标签。
Google 宣布 Bard AI 聊天机器人现可回答有关 YouTube 视频的问题
Google宣布其BardAI聊天机器人现在可以回答与YouTube视频内容相关的具体问题。尽管Bard在去年9月推出YouTube扩展功能时已具备分析YouTube视频的能力,但现在,聊天机器人可以为您提供有关视频内容的具体查询答案。」青少年可以询问Bard一些重要话题,如申请哪些大学,或更有趣的话题,如如何学习一项新运动。
谷歌Bard扩展YouTube Extension功能 可回答与视频相关的具体问题
其BardAI聊天机器人现在可以回答关于YouTube视频的问题。尽管在九月份推出YouTube扩展功能时,Bard已经具备分析YouTube视频的能力,但现在聊天机器人可以就与视频内容相关的查询提供具体答案。这也是谷歌向全球大多数国家的青少年开放Bard访问权限的一部分,使他们能够从中获取灵感,发现新的兴趣爱好,并解决日常问题。