剪映内测视频翻译功能 仅限移动端体验
备受瞩目的剪辑软件剪映再次迎来了重大更新,推出了全新的视频翻译功能。这一功能的推出,无疑将进一步巩固其在视频编辑领域的领先地位,为用户提供更加便捷、智能的服务。在翻译过程中,用户需要通过声音认证环节,以确保视频内容的真实性和安全性。
Adobe将生成式AI技术Firefly引入移动端 Express应用
Adobe正式将其生成式人工智能技术Firefly引入移动设备。最新版本的AdobeExpress测试版在Android和iOS上都推出了FireflyGAI功能,为用户提供了更广泛的图像创建和编辑选项。这一移动端整合意味着,Adobe正在将其人工智能生成能力从桌面端拓展至移动设备,以满足用户在不同场景下的创作需求,同时也将探索GAI技术的商业模式。
已上线!WPS移动端3个超实用新功能来了
今日,WPS官宣,移动端3个超实用新功能已上线。具体如下:1、图片翻译功能。教程:打开空白文档,输入帮我生成一份新品牌营销策划方案”,这时AI功能可自动生成一份完整且详细的的品牌营销策划方案,使用户创作更高效。
败走移动端之后,微软还是忘不了它的大一统之梦
如今要说哪一个科技巨头在这轮AI浪潮中分到了最大的一块蛋糕,毫无以为非慧眼识OpenAI的微软莫属。无论NewBing、还是MicrosoftCopilot,也都让外界看到了微软对于用AI改变大众日常生活的意图。如今的情况,是用户设备里的数据在实质上是平台和用户共管,数据流入其他平台对于平台方言则是一个极其敏感的问题。
三星或将推出更高端的折叠屏手机Galaxy Z Fold6 Ultra
三星或将推出更高端的折叠屏手机GalaxyZFold6Ultra据外媒报道,三星即将推出一款高端折叠屏手机,或许命名为GalaxyZFold6Ultra。这款机型与GalaxyS系列相同,也是三星对Fold系列产品进行划分的一部分。我们期待看到这款设备能够带来怎样的创新和优化,并期待着它在市场上的表现。
凤凰传奇告诉我们,最高端的商战往往以最朴素的方式出现
#听凤凰传奇听出了商战#这个话题突然登上了微博热搜,让人一头雾水。点进去一看,才知道,原来是网易云音乐和QQ音乐这对“老冤家”因为凤凰传奇又“打”了起来。优质的内容永远是音乐行业向前发展的根本动力。
三星 Galaxy S24 手机将能通过设备端的人工智能实时翻译电话内容
三星公司在最新的博客文章中确认,公司计划为Galaxy手机提供实时AI翻译电话通话的能力。三星公司表示,「明年初」GalaxyAI将为公司的智能手机带来新功能。三星预计将在2024年1月推出其新旗舰产品。
蚂蚁集团等发布开源大模型知识抽取框架OneKE
蚂蚁集团和浙江大学合作开发了一个名为OneKE的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务,为研究人员和开发者提供有力工具。他们将持续优化知识抽取的性能,并将相关技术应用到金融、医疗、政务等领域,推动可控生成技术的产业落地。
小鹏汽车与大众汽车集团签订EEA电子电气架构技术战略合作框架协议
小鹏汽车与大众汽车集团签订了EEA电子电气架构技术战略合作框架协议,双方将联合开发行业领先的电子电气架构。这一框架协议将使小鹏汽车最新一代基于中央计算和域控制器的电子电气架构集成到大众汽车在中国生产的电动车型上,预计从2026年开始应用。这一合作框架协议标志着小鹏汽车与大众汽车集团在中国市场电动车平台领域的战略合作,开启了双方合作的新里程碑。
北大发布新图像生成框架VAR 推理速度提高20倍
北京大学最近发布了一种新的图像生成框架,名为VAR。这一突破性的技术首次使GPT风格的自回归模型在图像生成上超越了扩散transformer,同时展现出了与大语言模型观察到的类似Scalinglaws的规律。VAR算法为计算机视觉中的自回归算法设计提供了新的见解,有望推动这一领域的进一步发展。
DreaMoving可控制AI视频生成框架使用地址 阿里dreamoving官方入口
DreaMoving是什么?DreaMoving是阿里一个基于扩散模型的可控制视频生成框架,用于生成高质量的定制人类舞蹈视频。DreaMoving能够适应大多数风格化扩散模型以生成多样化的结果。
「有效上下文」提升20倍!DeepMind发布ReadAgent框架
【新智元导读】模仿人类阅读过程,先分段摘要再回忆,谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能,有效上下文提升了3-20倍。基于Transformer的大语言模型具有很强的语言理解能力,但LLM一次能够读取的文本量仍然受到极大限制。还可以看到ReadAgentS大大优于ReadAgent-P,性能改进的代价是检索阶段的请求数量增加了六倍。
新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法
研究人员从清华大学和北京理工大学开发了DRAGIN,这是一种针对大型语言模型设计的动态检索增强生成框架。该框架旨在通过在文本生成过程中实时确定何时以及如何检索外部信息,从提高语言模型的性能。未来的工作旨在克服与自注意力可访问性相关的限制,并对查询构建技术的影响进行评估。
Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型
中国香港中文大学和SmartMore的研究人员推出了一种名为Mini-Gemini的新颖框架,通过增强多模态输入处理来推动VLMs的发展。Mini-Gemini采用了双编码器系统和一种新颖的补丁信息挖掘技术,结合一个特别策划的高质量数据集,使其能够有效处理高分辨率图像并生成内容丰富的视觉和文本内容,从使其脱颖出。正如研究人员所承认的那样,Mini-Gemini在视觉理解和推理能力方面仍有改进�
Meta推新框架OPT2I 提高SD图像生成一致性
Meta公司最近推出了一款名为OPT2I的新框架,该框架利用大型语言模型来提高SD图像从提示词到图像的生成过程中的一致性。OPT2I是一个优化框架,旨在提升T2I模型中的提示-图像一致性。OPT2I框架为提高T2I模型的提示-图像一致性提供了一种新的有效方法。
TOXCL:用于检测和解释隐性有毒言论的统一AI框架
社交媒体上的毒性言论可能会像野火般蔓延,特别是针对个人和边缘化群体。明显的仇恨言论相对容易被发现,但隐含毒性——依赖于刻板印象和编码语言不是明显的侮辱——提出了更为棘手的挑战。但通过谨慎使用,它为赋予边缘化声音权力和遏制网络上的压制性言论提供了一条道路。
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。每次只需要一个查询获得相似性能的集成方法需要40倍的查询量,也就是说可以节省很多算力资源。
视频转视频框架AnyV2V 可修改源视频主题、风格等
一项名为AnyV2V的全新视频转视频框架引起了广泛关注。这一框架的独特之处在于,它不仅支持对源视频进行深度修改能加入附加的控制元素,如文本提示、主题或风格,以生成一个既与原视频相符,又与所提供的控制内容相匹配的新视频。这一框架的推出,无疑为视频编辑领域带来了新的创新和可能性。
MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像 速度快30倍
在当今人工智能时代,计算机可以通过扩散模型生成自己的“艺术”,逐步向嘈杂的初始状态添加结构,直到清晰的图像或视频出现。扩散模型突然变得异常受欢迎:输入几个词,即可体验现实与幻想交汇的梦幻景象。当前版本使用StableDiffusionv1.5作为教师模型,学生继承了一些限制,如渲染文本和小脸部的细节描绘,这表明更先进的教师模型可能进一步提升DMD生成的图像。
HPT官网体验入口 HyperGAI多模态语言开源模型框架免费使用地址
HPT是HyperGAI研究团队推出的新型多模态大型语言模型框架。它具有高效且可扩展地训练大型多模态基础模型的能力,能够理解包括文本、图像、视频等多种输入模态。点击前往HPT官网体验入口需求人群:"适用于需要处理和理解多模态数据的研究人员和开发者,如进行视觉-语言任务、图像分析、图表解读等。