MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型
MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型StableDiffusion,取得了一系列显著的成就。MIT和Google的这一研究成果代表着AI图像生成领域的一次创新,尽管存在一些缺陷,但其对于高质量图像的生成提供了新的方法和思路。
OpenAI推出声音克隆新技术:复刻你的声音仅需15秒
OpenAI公司最近推出了一项革命性的声音克隆技术VoiceEngine”。VoiceEngine通过文本输入和15秒的音频样本,便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。当产品正式推向市场时,公司将设立一个禁止语音列表”,以检测并阻止与名人声音过于相似的人工智能生成声音,从避免潜在的版权和隐私问题。
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年5月,动动鼠标就能让图片变「活」得研究DragGAN吸引了AI圈的关注。我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。更多技术细节和实验结果请参阅原论文。
今日AI:多模态大模型Claude3发布;Gorq API开放申请;ChatGPT新增朗读功能;Stability AI发布SD3技术报告
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
视频新技术!Anything in Any Scene可以在视频中无缝插入任何物体
"AnythinginAnyScene"是一项新颖的技术,可以在现有的动态视频中无缝地插入任何物体,从增强视频的视觉效果和真实感。该技术的主要特点包括准确放置物体、真实模拟光照和阴影效果以及保持视觉风格一致性。4、为了在连续的视频帧中保持物体的稳定性和连贯性,采用动态跟踪和视频稳定技术,确保随着场景变化,插入的物体能够自然地移动和适应新的视角和位置,包�
Meta开发AudioSeal技术,可以秘密为 Deepfake 音频添加水印
Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。随着威胁形势的变化,更好的解决方案仍需要不断发展,以识别操纵风险并在人工智能能力不断增强的背景下建立对语音界面的信任。
科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型
科学家们在世界上最强大的超级计算机上取得了巨大突破,仅使用其8%的计算能力,成功训练了一个与ChatGPT规模相当的模型。这项研究来自著名的OakRidgeNationalLaboratory,他们在Frontier超级计算机上采用了创新技术,仅使用数千个AMDGPU就训练出了一个拥有万亿参数的语言模型。这项研究为未来训练巨大语言模型提供了宝贵的经验和方法,同时也突显了分布式训练和并行计算在实现这一目标上的关键作用。
腾讯推新技术Paint3D 给3D模型生成高清纹理
腾讯宣布推出一项名为Paint3D的技术,该技术在解决了生成没有内嵌光照信息的高质量纹理的挑战后,成为自动化纹理贴图生成领域的重大进展。Paint3D能够根据文本或图像输入,在无纹理的3D模型上生成高分辨率、无光照的多样化纹理贴图。更为重要的是,Paint3D生成的纹理贴图是没有内嵌光照阴影效果的,使得生成的纹理能够被重新照明或重新编辑,直接应用于现有的渲染管线
实时AI互动平台Albus Beta 巧妙融合GPT技术和多元化功能
AlbusBeta,作为一款实时的AI互动平台,通过引入GPT技术,旨在以全新的方式从多个视角深度挖掘用户所热衷的各类主题,使探索之旅更为有趣且富有成效。该平台的核心功能在于利用GPT技术,为用户提供一个实时的探索平台,使用户能够以崭新的视角来深入研究自己感兴趣的主题。这个平台不仅让探索变得更富有趣味性,同时也提升了用户对所关心主题的全面理解与掌握水平。
CardanoGPT 宣布 Girolamo AI 聊天机器人 Beta 版发布,将 AI 融入区块链技术
据一份新闻稿称,CardanoGPT宣布了其AI驱动聊天机器人Girolamo的Beta版发布,这标志着该公司将人工智能与区块链技术结合的重要一步。Girolamo得名于意大利著名数学家GirolamoCardano,这一发展象征着Cardano在区块链领域探索人工智能的新阶段。其开发是Cardano长期愿景和致力于推进区块链领域内AI发展的关键指标。
英伟达提出新技术Tied-LoRA 减少模型训练参数
Nvidia的研究人员提出了一种名为Tied-LoRA的新技术,旨在改善低秩适应方法的参数效率。该方法通过将权重绑定和选择性训练结合起来,寻找了在性能和可训练参数之间的最佳平衡。对比其他参数效率方法、讨论局限性并确定未来探索的潜在领域仍然是重要的。