苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型
苹果近日宣布与Shutterstock达成协议,授权使用数百万张图片来训练其人工智能模型。除了苹果之外,谷歌、Meta和亚马逊等科技公司也曾与Shutterstock达成类似协议,用于发展视觉AI引擎。其打算开发能够尽可能使用设备上技术的LLMs。
苹果推出AI动画设计工具Keyframer 可将静态图片转为动画
大型语言模型在动画设计领域的应用具有巨大潜力,但面临着挑战。苹果团队最近发布了一篇论文,宣布推出了一款名为Keyframer的AI动画设计工具。它为各种用户群体参与动画创作提供了可能,为动画设计领域的发展带来新的可能性。
AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
苹果开源的图片编辑神器MGIE怎么用?MGIE下载地址在哪
库克在苹果电话会上证实,「今年晚些时候会发布生成式AI」。这一消息引起了广泛的关注,尤其在ChatGPT掀起全球热潮之后,苹果也在悄悄发力AI领域。随着这一技术的不断完善和推广,相信将会给用户带来更多惊喜和便利。
苹果开源图像新技术ml-mgie 可通过指令修改图片
苹果开源了一种新的技术,名为多模态大语言模型引导的编辑,这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。MGIE采用多模态大型语言模型进行图像编辑指令的生成,通过端到端训练,模型不仅捕捉视觉想象力执行图像处理操作。在实现更加直观和自由的图像编辑过程中,这一方法有望为未来的计算机视觉和图像处理研究提供新的思路。
AI视野:文心一言支持生成数字分身;Bard推出图片生成功能;亚马逊开发AI购物助手Rufus;苹果将推生成式AI功能
三大调整抢先看!iPhone 16设计渲染图曝光:苹果欲放弃静音拨片
据国外媒体报道称,苹果正在对iPhone16的外形设计做调整从曝光的外形渲染图来看,调整还是比较明显。从曝光的CAD图来看,苹果可能重新设计iPhone16机身背面,采用垂直摄像头配置。现在的问题是,你对于这些所谓的外形设计调整,真的买单吗,毕竟iPhone在中国市场已经受到了华为等国产机的强烈冲击。
苹果iOS 17.4正式版重磅升级!国行iPhone支持下载离线地图
今日,苹果发布iOS17.4正式版升级,安装包大小1.7GB左右。虽然苹果未在更新日志中介绍,但经快科技实测,苹果在iOS17.4中正式开放了国行iPhone自带地图离线下载功能。打开优化储存空间”,让系统自动删除在一段时间内未使用的任何离线地图。
iPhone SE 4外观抢先看!CAD图首曝 苹果手机集体迈入全面屏时代
日前,海外媒体91mobiles首次曝光了苹果iPhoneSE4CAD渲染图,提前为大家展示了这款新机的外观设计。iPhoneSE4正面采用刘海屏设计,支持FaceID面部识别。从渲染图来看,苹果将在iPhoneSE4中彻底淘汰前两代机型中采用的iPhone8设计风格,转采用近几年的外观风格和更大的屏幕,整体设计与iPhone14标准版接近。
范伟主演苹果2024贺岁片《小蒜头》!库克点赞:iPhone的无限可能让人惊叹
从2018年开始,每年农历新年,苹果都会推出一部由最新款iPhone旗舰拍摄的短片电影,今年也不例外。苹果新春大片《小蒜头》正式发布,该片大咖云集,不仅有《超凡蜘蛛侠》导演马克韦布和《漫长的季节》编剧潘依然参与有影帝范伟参与主演。有网友表示:当所有人都还在围着参数、跑分转的时候,苹果跑到高了不止一档的维度,运用iPhone运动模式、5X变焦、电影模式的转换焦点、拍摄一部微电影。
苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率
习惯了StableDiffusion,如今终于又迎来一个俄罗斯套娃式Diffusion模型是苹果做的。在生成式AI时代,扩散模型已经成为图像、视频、3D、音频和文本生成等生成式AI应用的流行工具。感兴趣的读者可以阅读论文原文,了解更多研究内容。
InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型的稀疏视图重建技术,极大地优化了3D资产的创建过程。InstantMesh的出现,预示着3D建模和可视化领域将迎来新的变革,它将极大地提高工作效率,降低技术门槛,使得更多的人能够参与到3D内容的创作中来。
AI文生图模型PixArt-sigma,可以生成4K分辨率图片
PixArt-sigma由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散Transformer进行弱到强训练,旨在实现4K分辨率的图像生成。PixArt-sigma采用了弥散Transformer进行弱到强训练,从能够更好地生成高质量的4K分辨率图像。在应用方面,PixArt-Σ是一款强大的文本到图像生成工具,具有广泛的应用场景,可以满足艺术、设计、游戏开发、营销
EMO同款?微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频
由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。这项技术不仅能够实现音频与唇部动作的精确同步能够捕捉并再现丰富的面部表情和自然的头部动作,极大地增强了生成视频的真实感和生动性。所有在演示中使用的肖像图像,除了蒙娜丽莎外,都是由StyleGAN2或DALL-E-3生成的虚拟、不存在的身份
多模态语言模型Reka Core:可分析图片、视频、音频 评测得分与GPT-4接近
RekaAI近日宣布推出其最新力作——RekaCore,这是一款前沿的多模态语言模型,拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频,评测得分与GPT-4和Gemini-Ultra接近。通过Edge、Flash和Core等系列模型的全面支持,Reka已经准备好迎接更广泛的挑战,展望未来,我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。
无限重生图片样式,999次也没问题!
当我们使用Midjourney、DALL·E3、StableDifusion等模型生成图片后,想在保留主体大框架的情况下改变图片的样式,最直接的方法就是通过PS、AdobeLightroom、DxOPhotoLab等专业修图软件。但这对于很多人来说不太方便,也不符合AI时代的高效率处理方法。有兴趣的小伙伴可以去试试。
马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息
在人工智能领域,多模态模型的发展一直是行业关注的焦点。马斯克XAI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公司在人工智能技术上迈出了重要一步。随着该模型的进一步优化和应用,我们有理由相信,它将在多个领域发挥重要作用,推动人工智能技术向前发展。
facet ai怎么用?AI图片编辑修图工具Facet AI详细使用教程(附产品入口)
产品简介:FacetAI是一款创新的图像编辑工具,以实时图像生成和精确控制图像元素为核心优势,为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制,提高工作效率。侧边栏第二个按钮还支持对生成的图片进行风格,色调,光线的调整,这里就不一一赘述,大家可以根据自己的喜好来调整。
OpenAI发布GPT-4-Turbo 正式版 可识别图片
OpenAI发布了GPT-4-Turbo正式版,这是一个带有视觉能力的模型,能够处理128k的上下文。这个模型现在已经全面开放,可以通过“gpt-4-turbo”来使用,最新版本为“gpt-4-turbo-2024-04-09”。GPT-4-Turbo是一个功能强大的模型,它的发布将为AI领域带来新的可能。
AI图片编辑工具Facet怎么用?Facet AI详细使用教程(附产品入口)