谷歌将推全新AI视频工具Google Vids 集多种功能一体
有消息称Google将推出一款集多种功能于一体的AI视频工具——GoogleVids。这款工具旨在帮助用户轻松创作故事板,并通过AI技术协助编辑内容,选择适合的场景、图片和音乐,自动生成一个完整的类似PPT的宣讲视频。GoogleVids将于6月份登陆GoogleWorkspace,届时用户将能够更加便捷地使用这一工具,为自己的工作和学习带来更多便利。
Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐 时长达3分钟
著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐,时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术,用户可以期待更多高质量、多样化的音乐生成体验。
大地磁暴北方多地或能看到极光!但受多种因素影响
据“中国气象”官方微信公众号发布的消息,3月24日、25日和26日三天预计将出现地磁活动,尤其是3月25日,有可能发生中等以上地磁暴,甚至大地磁暴,这样的地磁活动预计将持续至26日。从观赏极光的角度来看,这次地磁暴活动为极光猎人们提供了一个难得的机会。无论是极光猎人还是信鸽玩家,都需要密切关注天气和地磁活动的变化,做好相应的准备和安排。
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的研究人员推出了一种面向3D环境的通用AI代理——SIMA。SIMA无需访问游戏的源代码,也不需要定制的API。研究人员表示,未来,会持续迭代SIMA的通用代理能力,希望可以在实际生活中帮助用户做更多的事情。
视频自动AI配音工具Pipio 可将视频翻译成多种语言并自动配音
在数字化时代,视频内容已成为信息传播的主要方式之一。语言差异常常成为信息传递的障碍。通过不断创新和优化,Pipio将继续在视频配音领域发展壮大,为用户带来更好的体验。
坦桑尼亚9人吃海龟肉中毒身亡:携带多种有害病菌和毒素
坦桑尼亚桑给巴尔群岛的奔巴岛发生了一起令人痛心的食物中毒事件。有8名儿童和1名成人因食用海龟肉不幸身亡,另有78人紧急住院治疗。政府和社会各界也应加强宣传和教育,提高公众对海龟保护的意识,共同守护这些珍贵的海洋生物。
今日AI:华为发布4K图像模型PixArt-Σ;这个ComfyUI插件可以还原梦境;Pika把音效视频一锅端了;公众号可以一键集成多种AI功能了
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景
随着Sora的爆火,人们看到了AI视频生成的巨大潜力,对这一领域的关注度也越来越高。除了视频生成,在现实生活中,如何对视频进行编辑同样是一个重要的问题,且应用场景更为广泛。如下表所示,UniEdit的表现大幅超过基线方法。
Eagle7B: 基于RWKV-v5架构、跨足100多种语言的7.52B参数AI模型
随着人工智能的发展,大型语言模型在各个领域开始受到广泛关注和应用。这些模型在数十亿级别的数据规模上进行训练,涵盖了健康、金融、教育、娱乐等多个领域,从自然语言处理和翻译到其他任务都发挥着重要作用。它突显了RWKV-v5架构的可扩展性,显示线性变换器可以达到与传统变换器相媲美的性能水平。
实时翻译工具Byrdhouse AI 可在视频通话中翻译100多种语言
ByrdhouseAI是一个强大的工具,可以在视频通话中实时翻译100多种语言。它提供了语音翻译字幕和AI驱动的实时口译功能,让用户在会议或聊天中可以将自己的语言转换成另一种语言。它还支持自动会议记录和多语言转录,为用户提供更多便利。
Portkey AI Gateway:一个连接多种人工智能模型的开源工具
PortkeyAIGateway是一个开源工具,旨在连接多种人工智能模型。该工具允许开发者通过简单的API接口访问超过100种不同的大语言模型,包括OpenAI、Anthropic、Mistral、LLama2、Anyscale、GoogleGemini等。这个工具的推出将为开发者们带来更便利的人工智能模型连接和使用体验,为AI开发领域带来新的可能性。
全能自动化工具Activepieces 集成OpenAI、Discord等80多种集成
Activepieces是一个开源的全能自动化工具,被视为流行的自动化平台Zapier的一个替代品。它提供了用户友好的工作流构建器,使用户能够轻松创建和管理自动化工作流。无论是个人用户还是企业用户,Activepieces都能满足他们的自动化需求。
LG最新的Gram系列笔记本充提供多种人工智能功能
LG最新发布的Gram系列笔记本在CES2024提前亮相,其中GramPro成为焦点,搭载了强大的IntelCoreUltra处理器和GeForceRTX3050GPU。这款笔记本还配备了Intel的人工智能增强技术,使其能够在没有网络连接的情况下处理人工智能工作负荷。我们将从2024年1月6日至12日期间的CES2024现场报道,为您带来最新的展会资讯。
韩联社:三星 Galaxy S24 系列新机内存版本曝光,提供多种配置选择
三星GalaxyS24系列新机内存版本曝光,提供多种配置选择。GalaxyS24和S24内存版本分别为8GB128GB和8GB256GBS24Ultra提供12GB256GB、12GB512GB和12GB1TB三种版本。分析师KimDong-won预测,由于持续减产,三星电子Q3的持续减产和DS部门亏损将达4000亿韩元。
EPFL与苹果研究人员开源4M:跨多种模态和任务训练多模态基础模型的人工智能框架
瑞士洛桑联邦理工学院与苹果联手推出了一项名为"MassivelyMultimodalMaskedModeling"的人工智能框架,旨在解决训练跨多模态视觉基础模型的挑战。尽管在自然语言处理领域,训练大型语言模型已经取得了显著成功,但在视觉领域,仍需要构建能够灵活处理多种输入模态和输出任务的模型。通过对4M性能影响的深入消融分析,结合该方法的简便性和通用性,研究人员认为4M在许多视觉任务和未来发展中具有巨大的潜力。
开源聊天机器人框架Lobe Chat 支持语音合成、多模态等多种功能
LobeChat是一个开源的、高性能的聊天机器人框架,支持多种先进功能。该框架的核心是语音合成、多模态以及一个可扩展的插件系统。作为一个开源项目,它吸引了大量开发者的参与,形成了一个充满创造力和活力的社区。
智源发布FlagAttention算子集 适配多种大模型训练芯片
为了满足大模型对计算资源的需求,智源研究院开发了FlagAttention项目,旨在构建一套适配多种芯片的大模型核心算子集合。该项目选择使用Triton作为开发语言,通过Triton的开放性和易用性,使得FlagAttention不仅支持NVIDIAGPU可以显著降低不同芯片之间模型适配的成本,提高大模型的训练与推理效率。FlagAttention还将支持更多功能,并与其他芯片厂商合作,优化算子的性能和适配。
小米澎湃OS系统字体MiSans升级:涵盖20 书写系统、600多种语言
小米今晚举行了小米澎湃OS体验沟通会,新系统字体MiSans进行了全面升级。MiSans具有超大生僻字库,总计87887字符,新增生僻字键盘,百度输入法小米版、讯飞输入法小米版、搜狗输入法小米版均已适配生僻字。澎湃OS采用生命感美学”设计,全局圆角,模糊混色与阴影,更自然;系统动效源于璀璨舞台艺术,更生动;美学融合生命与文明多样性,更包容。
谷歌推AI音乐实验项目Instrument Playground 能模拟100多种乐器
谷歌最新实验性AI项目“InstrumentPlayground”已面世,允许人们通过一个文本提示生成20秒的音乐曲目。与Meta的MusicGen等类似项目相比,谷歌的版本声称能够模拟来自世界各地的100多种乐器,包括常见的钢琴和中国的笛子等。期待在未来看到更多的发展。
《一念关山》三天热度直冲9500,爱奇艺古装赛道的多种可能
前一秒还是在献艺时与世子眉目传情的魅惑舞姬,后一秒却成为了武功高绝的孤冷刺客。原以为是“战死沙场”的伙头军,不曾想却是让人闻风丧胆的六道堂前堂主。懦弱不受宠的小公主,摇身一变成为肩负迎帝使命的“礼王”。凶神恶煞、杀人如麻的大反派,却不曾想分分钟极速下线领盒饭……这样反转不断的人物与剧情出自于爱奇艺新晋爆款担当《一念关山》。纵观Q4,前