OpenAI:不能“随意”用版权作品训练AI,还玩啥?输给中国好了!
OpenAI表示,不管版权所有者有啥担忧,尽可能多地向 AI 公司输送数据,才是实现美国全球 AI 领导地位的唯一途径……
为训练AI不择手段!Meta被曝下载数十TB盗版电子书
一名图书作者对Meta提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其AI模型。最新泄露的邮件显示,Meta承认下载了一个有争议的大型数据集LibGen,其中包括数千万本盗版书籍。但Meta仍决定继续,并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。
防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎
据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索、YYSpider和宜搜搜索等少数几个搜索引擎被允许抓取其内容。不过百度百科这种做法其实也只是防君子不防小人,肯定还有很多爬虫通过各种方式继续抓取内容然后拿去训练AI。
Adobe更新隐私条款 意味着有权将用户作品用于训练AI
Adobe最近更新了其隐私条款,其中引起了用户的关注和担忧。根据新条款,Adobe声称“我们有可能以自动或人工方式访问你的内容”。这也引发了关于个人隐私权和知识产权保护的更大讨论。
阿里蔡崇信最新发声!训练AI就像教育孩子 三四年就能赶超博士
快科技6月2日消息,阿里巴巴集团的董事长蔡崇信,在最新一次对话中,对人工智能的快速发展和未来前景进行了深入的阐述。他将训练AI模型的过程比喻为教育孩子,大语言模型的发展竞赛,就像家长展示自己孩子的学术成就一样。尽管培养一个孩子需要22年时间,但AI在三四年内就能在知识和某些数学计算方面达到与人类相当的水平,甚至在某些领域达到博士生水平,这种进
Meta被曝使用Instagram等照片训练AI模型引发隐私争议
全球社交巨头Meta最近因使用用户照片训练AI模型Emu引发了一场隐私争议。Meta正在利用Instagram和Facebook上的用户照片进行训练,同时还会使用用户对图片的描述、标题等文本数据。在数据隐私和保护方面,企业应该加强合规措施,确保用户的个人信息得到妥善处理和保护。
索尼向700多家公司发出警告,禁止使用其音乐数据训练AI模型
索尼音乐集团发出警告,禁止未经许可的公司使用其音乐数据训练大型AI模型。这一警告涉及到700多家公司,索尼明确表示未经许可不得使用其音乐数据进行文本挖掘、网络爬取以及其他形式的数据搜集,包括录音、音乐作品、封面艺术作品和元数据等。索尼的警告表明了对知识产权的重视,以及对AI模型在音乐数据使用上的监管和控制。
美国新法案要AI公司透露用于训练AI模型受版权保护的作品
美国国会于周二提出了一项法案,旨在强制人工智能公司透露他们用于训练生成AI模型的受版权保护的材料。这项立法进一步加入了立法者、新闻机构和艺术家为了确定AI公司如何使用诸如歌曲、视觉艺术、书籍和电影等创作作品来训练他们的软件,并且这些公司是否违法侵犯版权的种种努力。一组200多位知名音乐艺术家发布了一封公开信,呼吁加强对人工智能的保护,并要求公司不开发可能削弱或取代音乐家和词曲作者的工具。
苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型
苹果近日宣布与Shutterstock达成协议,授权使用数百万张图片来训练其人工智能模型。除了苹果之外,谷歌、Meta和亚马逊等科技公司也曾与Shutterstock达成类似协议,用于发展视觉AI引擎。其打算开发能够尽可能使用设备上技术的LLMs。
谷歌豪掷6000万美元购买Reddit 数据 用来训练AI模型
Reddit最近宣布与一家未透露的公司签署了一份价值6000万美元的合作协议,允许对Reddit用户内容进行访问以训练AI模型。揭晓这家神秘公司正是谷歌。Reddit与谷歌的合作将为AI发展和数据资源利用提供新的契机,也展现出社交媒体平台在AI时代的重要性。
宾夕法尼亚大学工程师研发可用光波训练AI的芯片
工程师们在宾夕法尼亚大学成功研发了一款全新的芯片,利用光波进行训练人工智能所需的数学计算。这一创新被认为有望彻底改变计算机芯片的性能,不仅能够大幅提高处理速度能降低能源消耗,有望在在线隐私保护方面发挥重要作用。这一硅光子芯片的研发标志着计算机技术领域的一项重大突破,有望推动人工智能领域的发展,并在计算性能和隐私保护方面带来革命性的变革。
Meta承认使用盗版书籍训练AI:拒绝赔偿作家
Meta最近因使用数千本盗版书籍训练人工智能模型存在法律风险引发版权侵权诉讼。Meta使用大量盗版书籍的Books3”数据集训练其LLAM1和LLAM2模型,Meta虽承认使用了Books3数据集,却拒绝向作者支付适当的补偿。欧盟关于人工智能的新临时规则可能会迫使公司披露用于训练模型的数据集,这可能会使他们面临更大的法律风险。
Midjourney训练AI使用的艺术家数据库名单泄露引发争议
用于训练Midjourney的生成式人工智能程序的艺术家数据库已泄露,引起社交媒体和艺术界的广泛争议。泄露的名单中包括一些知名艺术家,如Banksy、DavidHockney等。Midjourney尚未回复Hyperallergic的评论请求这一事件也进一步引发了对未受监管的生成式人工智能发展的担忧,包括未来就业和版权侵犯的指控,促使了更多的诉讼和国会听证会。
OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」
为了拆开大模型的「黑箱」,Anthropic可解释性团队发表了一篇论文,讲述了他们通过训练一个新的模型去理解一个简单的模型的方法。Anthropic发表的一项研究声称能够看到了人工智能的灵魂。我们是否也在模拟一个更大的大脑?目前这还是一个非常新的研究领域,但已经有一些初步的发现,表明人类视觉皮层中的神经元确实以某种超定位的方式编码特征,与AI模型中观察到的模式相似。
MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型
MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型StableDiffusion,取得了一系列显著的成就。MIT和Google的这一研究成果代表着AI图像生成领域的一次创新,尽管存在一些缺陷,但其对于高质量图像的生成提供了新的方法和思路。
隐私浏览器Brave发布“匿名且安全”AI聊天机器人Leo 承诺不用户数据训练AI
隐私导向的浏览器Brave最近推出了名为Leo的本地AI助手,该公司声称相比其他AI聊天机器人服务,Leo提供了“无与伦比的隐私”。经过数月的测试,Leo现在可供所有运行浏览器版本1.60的Brave桌面用户免费使用将在未来几个月内分阶段推出到Android和iOS平台。我们相信随着时间的推移将提供更多的模型供用户选择。
AI版权官司:Meta、微软等遭集体诉讼 侵权用他人书籍训练AI
前阿肯色州州长迈克·哈克比与其他一些作者正在对Meta、微软以及其他公司提起诉讼,指控它们未经授权使用他们的作品来开发人工智能工具。在本周提交的一项诉讼中,哈克比以及包括基督教作家莉莎·泰克赫斯特在内的其他作者声称,他们的书籍被盗版并用于训练AI模型的数据集。GettyImages起诉AI艺术工具StableDiffusion的公司,声称其非法复制数百万张受版权保护的图像来训练模型。
丰田训练AI机器人制作早餐,无需编码、通过触觉学习
丰田研究院近日宣布,他们成功使用生成式人工智能在“机器人幼儿园”中培训机器人执行各种灵巧任务无需进行繁琐的编码工作。这一突破性的技术使得机器人可以通过触觉感知和学习,像人类一样执行各种任务。与丰田研究人员的方法类似,他们的机器人利用他们所获得的经验来推断如何做事。
B站UP主用1300条B站热门标题训练AI 自制“赛博主编”
B站UP主“差评君”发布了一条名为“我们用1300条B站热门视频,做了一个能读懂B站的取标题机器人”的视频。他通过训练生成了一个能自动生成标题的AI“赛博主编”,该AI能够根据过往的热门视频内容和观众口味生成符合B站观众口味的标题。这种技术的出现将极大地方便了人们的生活和工作,同时也为AI技术的发展提供了新的可能性。
马斯克禁止第三方抓取X数据训练AI模型
X公司更新了其服务条款,明确规定从9月29日起,任何第三方未经书面许可不得在X平台上获取数据用于训练AI模型。埃隆·马斯克一直反对第三方利用X平台上的数据来训练AI模型。马斯克对此进行了解释,他说X只会使用公开的信息来训练AI模型,不会涉及任何私密内容。