今日AI:Gemini Pro1.5向所有人开放;Stable Diffusion核心团队集体离职;HeyGen5.0上线视频翻译功能;剪映内测视频翻译功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
极星手机Polestar Phone证件照出炉:基于魅族21 Pro设计
极星手机PolestarPhone目前已经入网,型号显示为M481S。从入网图片可以看出,新机的外观与魅族21Pro外观一致,将MEIZU”标识改为PolestarPhone”均为珠海市魅族科技有限公司生产。魅族21Pro内置5050mAh电池,采用了80W有线充电50W无线充电解决方案。
极星手机 Polestar Phone 工信部证件照出炉,基于魅族21 Pro设计
工信部现已公布极星手机入网证件照,该机型为魅族21Pro的改款产品,由珠海市魅族科技有限公司生产。该机型与魅族21Pro在申请3C认证时一同申请,因此可以视作同一款机型的不同名称。新机号称“魅族首款开放式AI终端”,Flyme10.5依托AI大模型将逐步上线多项AI趣味实用功能,例如Aicy语音化身随叫随到贴身助理等。
Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话
MetaAI最近发布了MMCSG数据集,该数据集包含使用ProjectAria录制的25小时以上的双向对话。CHiME-8MMCSG任务的重点是转录使用智能眼镜录制的对话,这些眼镜配备了多个传感器,包括麦克风、摄像头和惯性测量单元。MMCSG数据集的提供为在动态现实环境中开发和评估转录系统提供了宝贵资源。
ControlNet作者新作:AI绘画能分图层了,项目未开源就斩获660 Star
“绝不是简单的抠图。”ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用StableDiffusion可以直接生成单个或多个透明图层!例如来一句:可以看到,AI不仅生成了符合prompt的完整图像,就连背景和人物也能分开。毕竟张吕敏也被网友调侃为“时间管理大师”,对LayerDiffusion感兴趣的小伙伴可以提前mark一波了。
Jasper公司收购Stability AI旗下的AI图像平台Clipdrop
AI企业软件公司Jasper成功完成对StabilityAI旗下ClipdropAI图像平台的收购。该平台以其强大的图像编辑工具闻名,用户可通过JasperAPI获得企业服务消费者仍可在Clipdrop.co购买独立版本。这次收购将进一步推动Jasper公司在AI图像处理领域的市场份额,同时StabilityAI则通过出售Clipdrop来缓解其财务压力,为其未来发展寻找更稳固的方向。
OpenAI推出“Meta-Prompting”,显著提升GPT-4等模型内容准确性
OpenAI、斯坦福大学的研究人员推出了一个创新大模型增强框架——Meta-ProMetating。Meta可增强GPT-4、PaLM和LLaMa等模型的性能,使生成的内容更加精准、安全可靠。指挥模型再根据这些反馈进行调整和修正并进行自适应学习,以生成更准确和可靠的最终答案。
AI视野:大模型最快推理芯片Groq登场;真人视频冒充Sora;Stable Diffusion WebUI Forge推出;字节辟谣推出中文版Sora
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Yi Tay官宣新模型Reka Flash 性能媲美Gemini Pro
YiTay领导的团队发布了21B的多模态语言模型RekaFlash,其性能与GeminiPro和GPT-3.5相媲美。这一模型在多个基准测试中取得了出色的成绩,尤其在多语言推理和视觉基准测试中表现突出,超越了其他大型模型。这也预示着在人工智能领域,特别是在自然语言处理和计算机视觉方向,将迎来更多创新和突破。
苹果Vision Pro发售:竞争对手Meta单日大涨20%创纪录!
苹果的首款头显设备VisionPro在2月2日正式开售,但其竞争对手Meta的股价则是单日大涨超过20%,一天市值增加超过2000亿美元,创造了美股历史记录。2023年9月份,Meta公司发布了Quest3头显,售价为499.99美元起。并且将电池和VisionPro加在一起,总重量已超一公斤,相比之下,Quest3的重量为515克。
AI视野:Meta发布Code Llama70B;Nijijourney V6模型正式上线;Chrome将内置AI写作助手;Minimax的AI对话机器人海螺问问上线
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。在加入微软研究院之前,他曾在乔治亚理工学院和丰田工业大学芝加哥分校担任计算机科学助理教授。
Meta推机器人框架OK-Robot 机器人收拾房间就要实现了?
Meta和纽约大学合作开发的机器人框架OK-Robot,让我们离实现机器人收拾房间的目标又近了一步。这一新型开放知识型机器人框架融合了前沿的视觉语言模型来识别物体,预先训练好的机器人抓取模型,以及经过实战考验的算法,如1968年的A*算法用于导航。这一成果为机器人在家庭环境中执行日常任务提供了新的可能性。
字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA
过去一年扩散模型风头正劲,彻底改变了文生图领域!那么,扩散模型能否处理视觉感知任务?字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。随着技术的进步,这些方法可能会进一步完善。
谷歌 Android Auto 使用 Google Assistant 和 AI 总结消息
谷歌公司正在为其AndroidAuto平台开发一项新功能,该功能将利用谷歌助手和人工智能技术来总结信息。根据9To5Google的报道,他们对上传到Play商店的谷歌应用程序14.52版本进行了反编译,并发现了这一功能的代码行。随着智能汽车技术的不断发展,谷歌此举也显示了该公司在提升驾驶者体验方面的创新努力。
Redmi K70/K70 Pro OTA升级发布!屏幕频闪比友商更低
日前,Redmi市场总经理、Redmi品牌发言人王腾微博发文对屏幕SVM”进行了科普,同时宣布将为RedmiK70、K70Pro推送OTA升级,终结友商数字游戏。Redmi手机宣布,K70、K70Pro全量升级今日起陆续上线,升级后屏幕SVM低于0.1,号称小米青山护眼再进化”。但鉴于友商一直在大肆宣传这个指标,所以才有了本次K70、K70Pro的OTA升级,升级后SVM比友商更低。
训练效率提升40倍!开源图片生3D模型,Stable Zero123来啦
12月14日,著名生成式AI开源平台Stability.ai在官网开源了,图片生成高质量3D模型——StableZero123。StableZero123是基于今年3月,丰田研究院和哥伦比亚大学联合开源的Zero123模型开发成。StableZero123模型主要用于研究,未来会开放商用。
Meta AI团队再失大将:R-CNN作者Ross Girshick离职
Meta的FAIR团队再次迎来一位大佬级研究科学家的离职消息,R-CNN的作者RossGirshick决定离开Meta,加盟艾伦人工智能研究所。这也是近期FAIR团队内部的一系列离职动荡中的最新发展。这一系列的动荡也让业界对Meta在AI领域的发展保持关注,以期看到他们在人才留存和创新方面取得更多进展。
CardanoGPT 宣布 Girolamo AI 聊天机器人 Beta 版发布,将 AI 融入区块链技术
据一份新闻稿称,CardanoGPT宣布了其AI驱动聊天机器人Girolamo的Beta版发布,这标志着该公司将人工智能与区块链技术结合的重要一步。Girolamo得名于意大利著名数学家GirolamoCardano,这一发展象征着Cardano在区块链领域探索人工智能的新阶段。其开发是Cardano长期愿景和致力于推进区块链领域内AI发展的关键指标。
南开山大等开发trRosettaRNA 一种基于深度学习的自动化RNA 3D结构预测方法
南开大学、山东大学以及北京理工大学的联合团队成功开发了一种基于深度学习的自动化RNA3D结构预测方法,命名为trRosettaRNA。该方法采用Transformer网络,通过进行1D和2D几何形状预测,再通过能量最小化实现3D结构折叠。我们期待着深度学习方法在RNA结构预测方面的进一步发展,为理解RNA分子的生物学功能提供更为准确的工具和方法。