DeepMind CEO称谷歌将在 AI 领域投入超过 1000 亿美元
谷歌的AI业务负责人表示,该公司将在未来投入超过1000亿美元开发人工智能技术,这是硅谷正在进行的投资竞赛的又一迹象。在温哥华举行的TED大会上,谷歌DeepMind首席执行官DemisHassabis被问及有关微软公司和OpenAI正在规划的一台名为“星门”的潜在价值1000亿美元的超级计算机的问题。”OpenAI的ChatGPT引发的全球兴趣表明,公众已经准备接受人工智能系统,即使这些系统仍然存在缺陷和错误。
谷歌发布 “Vlogger” 视频模型框架:单张图片生成 10 秒视频
谷歌最近发布了一项名为“Vlogger”的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。随着技术的不断进步和完善,相信Vlogger将在未来有更广泛的应用和发展。
谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?
RAG还有存在的必要吗?要说最近最郁闷的公司,谷歌肯定算得上一个:自家的Gemini1.5刚刚发布,就被OpenAI的Sora抢尽了风头,堪称AI界的「汪峰」。谷歌这次推出的是用于早期测试的Gemini1.5的第一个版本——Gemini1.5Pro。下面是相应幻灯片的快照:@elvis表示,他已经开始着手进行第二轮测试,感兴趣的同学可以去X平台上围观。
谷歌10秒视频生成模型破世界记录!LLM终结扩散模型,效果碾压顶流Gen-2
【新智元导读】谷歌全新视频生成模型VideoPoet再次引领世界!十秒超长视频生成效果碾压Gen-2可进行音频生成,风格转化。AI视频生成,或许就是2024年下一个最前沿的领域。对于未来的研究方向,谷歌研究人员表示,VideoPoet框架将会实现「any-to-any」的生成,比如扩展文本到音频、音频到视频,以及视频字幕等等。
谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物
谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。这一开放访问的“VALID”库被定位为研究人员和开发。
谷歌推AI音乐实验项目Instrument Playground 能模拟100多种乐器
谷歌最新实验性AI项目“InstrumentPlayground”已面世,允许人们通过一个文本提示生成20秒的音乐曲目。与Meta的MusicGen等类似项目相比,谷歌的版本声称能够模拟来自世界各地的100多种乐器,包括常见的钢琴和中国的笛子等。期待在未来看到更多的发展。
1分钟预测10天全球天气!谷歌DeepMind全新AI天气预报登上Science,碾压行业SOTA
【新智元导读】谷歌DeepMind再次在科学细分领域——天气预报迈出重要的一步。全新AI模型GraphCast可在1分钟内,精准预测10天全球天气,甚至还可以预测极端天气事件。在看了研究介绍之后,网友表示,谷歌你快出个应用啊!对于天气预报的能力,很多网友表示,现在已经可以期望预报的精细度到不同街道,并且精确到分钟了。
谷歌DeepMind发布全新AI天气预报模型GraphCast 1分钟预测10天全球天气
谷歌DeepMind最新推出的全球天气预报AI模型GraphCast引起科学界瞩目。这一模型不仅能在短短1分钟内预测未来10天的全球天气,甚至还能准确预测极端天气事件。这一模型的推出标志着天气预报迈出了重要一步,为未来的气象研究和防灾工作提供了创新性的解决方案。
1/10体量达到SOTA!谷歌发布5B参数视觉语言模型PaLI-3,更小更快却更强
堪称改变游戏规则的视觉语言模型PaLI-3问世,引得大量科研人员关注。PaLI-3是谷歌最新推出的视觉语言模型,以更小的体量,更快的推理速度,达到了更强的性能。PaLI-3还未完全开源,但是开发人员已经发布了多语言和英文SigLIPBase、Large和So400M模型。