腾讯AI实验室联合悉尼大学引入了GPT4Video 提升LLM的视频生成能力
最近在多模态大型语言模型领域取得了显著进展,但在多模态内容生成方面仍存在明显的空白。为了填补这一空白,腾讯AI实验室和悉尼大学的合作引入了GPT4Video,这是一个统一的多模型框架,使得大型语言模型具备了视频理解和生成的独特能力。该研究还提出了一种简单有效的微调方法,并发布了数据集,为未来的多模态LLMs研究提供了便利。
极空间AI实验室体验入口 AI搜索图像处理使用方法教程指南
极空间AI实验室 是北京天顶星智能信息技术有限公司推出的家庭私有云产品中的新功能。它包括自然语言搜索、相似图片搜索和图片文字识别等功能,旨在帮助用户更快捷地管理和使用存储在极空间中的图片。点击前往极空间AI实验室体验入口需求人群:适用于需要管理和快速检索大量图片的用户,如家庭用户、摄影师、设计师等。使用场景示例:使用自然语言搜索功能快速找
上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)
InternLM-XComposer2是一款先进的视觉-语言模型,在自由组合文本和图像以及理解这两者之间的内容方面表现卓越。这款模型不仅超越了传统的视觉-语言理解能够巧妙地将多样化的输入,如概要、详尽的文本描述和参考图片,融合成包含文本和图像的复合内容,实现高度定制化的创作。这使得InternLM-XComposer2成为当前领先的视觉-语言模型之一,为多领域的创作和理解任务提供了卓越
阿里巴巴通义实验室开源AI图像生成微调框架SCEdit
SCEdit是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队提出。该框架可以用于图像生成任务的微调,并支持快速迁移到特定的生成场景中。在可控生成任务中,SCEdit可以实现对生成结果的精准控制,并节省30%的内存使用。
AI视野:GPT-4 API曝出重大漏洞;阿里巴巴推AI画图框架SCEdit;上海AI实验室浦医2.0发布
上海AI实验室升级发布“浦医2.0”上海人工智能实验室与上海交通大学医学院附属瑞金医院等在“2023健康中国思南峰会”上发布了医疗多模态基础模型群“浦医2.0”,为跨领域、跨疾病、跨模态的AI医疗应用提供全面支持。用户可定制图�
上海AI实验室开源图文混合创作大模型浦语灵笔
上海人工智能实验室近日推出了首个图文混合创作大模型书生·浦语灵笔,该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。浦语灵笔是基于书生·浦语大语言模型的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B及20B版本的大语言模型,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。浦