Google Bard 全球更新:支持40种语言、添加图像生成功能
GoogleBard今天宣布进行全球更新,将GeminiPro大语言模型功能扩展到40种语言,并为其添加图像生成功能。Bard还获得了来自领先基准的新质量认可。此次更新是Bard发展过程中的重要一步,它将使Bard更加易于使用和更具竞争力。
谷歌 Duet AI 现在可以移除 Google Slides 和 Drawings 中的图像背景
谷歌最近推出了一项新功能,用户现在可以在Google幻灯片和绘图中轻松移除图片背景。这一新增功能是谷歌DuetAI技术的一部分,旨在提升用户的编辑效率和体验。通过这种方式,谷歌继续扩展其AI技术的应用范围,并为用户提供更加高效和直观的编辑工具。
MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型
MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型StableDiffusion,取得了一系列显著的成就。MIT和Google的这一研究成果代表着AI图像生成领域的一次创新,尽管存在一些缺陷,但其对于高质量图像的生成提供了新的方法和思路。
人工智能让 Google 地图变得越来越像「搜索引擎」
Google正在为其地图服务增加一系列新的人工智能驱动功能,包括更沉浸式的导航、更易于遵循的驾驶指示和更好组织的搜索结果。最终效果将让许多用户感觉到Google地图的体验与Google搜索相似。汽车公司可以使用PlacesAPI来构建更多的电动汽车充电信息,以便他们的客户可以直接在车辆的信息娱乐屏幕上看到实时位置信息、插头类型和充电速度。
Google 搜索现在可以帮助验证图像的来源
谷歌开始推出新的“关于此图像”工具,旨在提供有关谷歌搜索中图像的基本背景信息和上下文。该功能首次在5月份的GoogleI/O开发者大会上宣布,现在正在向全球英语用户推出。这些人工智能生成的描述将显示在“关于此结果”工具中,旨在当维基百科或谷歌知识图等现有来源没有较小网站上的信息时进行填充。
CMU与Google DeepMind研究人员推出AlignProp:微调文本到图像扩散模型的创新方法
卡内基梅隆大学和GoogleDeepMind的研究人员引入了一种突破性的方法,称为"AlignProp"。该方法利用直接反向传播来微调文本到图像扩散模型,解决了将这些模型与所需的奖励功能对齐的挑战。未来的研究方向未来,研究人员可以探索将AlignProp的原则扩展到基于扩散的语言模型,以增强其与人类反馈的一致性。
混合现实社交平台Wooorld 将3D世界地图带入用户的房间
Wooorld,一款基于MetaQuest混合现实技术的社交平台,为用户带来了全新的虚拟体验。通过混合现实技术,Wooorld将一个3D的世界地图带入用户的房间,不仅允许用户探索世界提供了多样化的游戏功能,其中包括能够将用户随机传送到170个国家不同位置的有趣游戏。这使得Wooorld成为一款兼顾探险和游戏的综合性社交平台,为用户带来了全新的虚拟社交体验。
《暗区突围》全地图光线追踪功能来了:iQOO 12首发
在今晚的发布会上,iQOO12系列手机正式亮相。作为主打游戏体验的性能产品,iQOO12系列首发了其全栈自研的Q1电竞芯片自研算法。在《王者荣耀》上,iQOO12系列在120帧、极致画质、60分钟的条件下,实现了平均帧率119.9,机身最高温度也只有40.5摄氏度。
AI系统能够比人类快1万倍地从卫星图像中绘制巨大冰山地图
科学家们在一项最新研究中成功地训练了一种人工智能系统,可以在卫星图像上准确地绘制巨大冰山的表面积和轮廓,速度比人类快10,000倍。这项名为《利用深度学习绘制南极巨大冰山的范围》的研究成果发表在《TheCryosphere》杂志上。随着机器学习的发展,算法将通过学习对卫星图像解释的错误变得更加精确。