谷歌 Duet AI 现在可以移除 Google Slides 和 Drawings 中的图像背景
谷歌最近推出了一项新功能,用户现在可以在Google幻灯片和绘图中轻松移除图片背景。这一新增功能是谷歌DuetAI技术的一部分,旨在提升用户的编辑效率和体验。通过这种方式,谷歌继续扩展其AI技术的应用范围,并为用户提供更加高效和直观的编辑工具。
每日AI:谷歌推AI视频VideoPrism;ChatGPT新增文本朗读功能;Stability AI推图片放大工具Creative Upscaler;Stable Diffusion安卓版客户端来了
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物
谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。这一开放访问的“VALID”库被定位为研究人员和开发。
今日AI:suno v3模型要抢歌手饭碗?字节发布AnimateDiff-Lightning模型;谷歌发布Vlogger视频模型;博主用AI做长篇漫画上架腾讯
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI视野:谷歌开源小参数大模型Gemma;李一舟AI课程小程序因违规被暂停服务;Sora AI视频生成器模板sorafm开源;字节跳动开发 SDXL-Lightning
LinkedIn分析显示苹果员工最有可能跳槽加入谷歌
根据对科技行业LinkedIn个人数据的分析显示,苹果前员工最喜欢的目的地是谷歌。这一分析结果揭示了科技行业的动态变化,尽管苹果员工很可能来自英特尔、微软或亚马逊等公司。这与Meta、谷歌和Salesforce组建了对比对比。
1/10体量达到SOTA!谷歌发布5B参数视觉语言模型PaLI-3,更小更快却更强
堪称改变游戏规则的视觉语言模型PaLI-3问世,引得大量科研人员关注。PaLI-3是谷歌最新推出的视觉语言模型,以更小的体量,更快的推理速度,达到了更强的性能。PaLI-3还未完全开源,但是开发人员已经发布了多语言和英文SigLIPBase、Large和So400M模型。
谷歌发布PaLI-3视觉语言模型 小体量达到SOTA!
谷歌最新发布的PaLI-3视觉语言模型在小体量下实现了SOTA性能,引起广泛关注。这款模型以更小的体量和更快的推理速度实现更强大的性能,是谷歌去年推出的多模态大模型PaLI的升级版。这一创新有望影响视觉语言模型的未来发展方向,提供更高效的解决方案。
谷歌推出新英语辅导工具挑战Duolingo
谷歌近日发布了一款新的英语辅导工具,旨在挑战Duolingo等语言学习应用。这一工具将在接下来的几天内逐步在Android设备上的搜索中推出,首批覆盖了阿根廷、哥伦比亚、印度、印度尼西亚、墨西哥和委内瑞拉。谷歌在语言学习和教育工具方面并不陌生,此次的举措令人期待,但最终的增长计划可能取决于用户对这一服务的接受程度。
谷歌视觉语言模型PaLI-3问世,参数仅5B,更小、更快、更强
在多模态大模型领域,拼参数赢性能的同时,追求参数更小、速度更快、性能更强是另一条研究路径。在大模型时代,视觉语言模型的参数已经扩展到了数百甚至数千亿,使得性能持续增加。表7和表8评估了模型的公平性、偏差和其他潜在问题。
谷歌表示其 Green Light 人工智能系统正在改善城市交通流量
它创建的一种人工智能系统正在帮助改善世界主要城市的交通流畅度。该系统名为「ProjectGreenLight」,目前在12个城市中使用。它计划继续将「ProjectGreenLight」扩展到更多的城市,并邀请来自世界各地的城市规划师和工程师加入该计划的候补名单。
谷歌 I/O 开发者大会5月14日举行 聚焦Gemini模型与Android15
谷歌宣布于5月14日在线举办2024年I/O开发者大会。与去年一样,主题演讲将通过网络直播形式进行,任何人都可以通过网络参与观看。这将吸引更广泛开发者关注。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。尽管对比基线已经在K400上取得了有竞争力的结果,但所提出的全局蒸馏和token洗牌进一步提高了准确性。
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
谷歌VideoPoet项目ResearchLead,CMU兼职教授蒋路的GoogleScholar资料显示已加入TikTok。有传闻TikTok招募了某篇论文的作者作为北美技术部门负责人,研发能和Sora对抗的视频生成AI。有关未来的研究方向,谷歌研究人员表示,VideoPoet框架将会实现「any-to-any」的生成,比如扩展文本到音频、音频到视频,以及视频字幕等等。
谷歌推出Android机器人公仔:售价超百元 销量火爆
谷歌推出了一款TheBot”安卓机器人公仔,售价为16美元。这款与DeadZebra团队多年来销售的公仔类似,这款公仔的手臂可以摆动,更符合谷歌去年推出的全新3D安卓吉祥物。除了机器人形象公仔,谷歌商品店还提供水瓶、衬衫、钢笔、马克杯、贴纸、别针、袜子和太阳镜等各式各样的Android周边产品。
谷歌发布Android15首个开发者预览,竟未提及人工智能
Google于2月19日发布了Android15的首个开发者预览,然令人意外的是,该文章在整个内容中没有提及人工智能的任何信息。工程副总裁DaveBurke在文章中首先强调了PrivacySandbox在Android上的最新版本的加入,这被宣称既能提供“用户隐私”,又能提供“移动应用的有效个性化广告体验”。尽管Burke的文章中未提及,但预计Android15将在2024年的某个时候发布,可能会包含大量人工智能技术�
谷歌推出Android 15开发者预览版:功耗管理更强大
谷歌正式发布了Android15开发者预览版,在功耗管理以及隐私上有所改进。谷歌计划在春季初推出公开测试版。谷歌开始为第三方应用程序进行更好的相机优化,在弱光环境下拍摄的图像将被实时处理,提供明亮的预览,第三方应用也可以从改进的预览图像中受益。
AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro
AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
谷歌推“Circle to Search”AI搜索功能,用手势在Android设备就能随意搜索
谷歌在与三星的联合发布活动中宣布了一项新的Android手机搜索功能,名为“CircletoSearch”。这一功能的目的是通过手势操作更自然地与Google搜索进行互动。随着时间的推移,更多的Android智能手机将支持这一功能。