腾讯AI实验室联合悉尼大学引入了GPT4Video 提升LLM的视频生成能力
最近在多模态大型语言模型领域取得了显著进展,但在多模态内容生成方面仍存在明显的空白。为了填补这一空白,腾讯AI实验室和悉尼大学的合作引入了GPT4Video,这是一个统一的多模型框架,使得大型语言模型具备了视频理解和生成的独特能力。该研究还提出了一种简单有效的微调方法,并发布了数据集,为未来的多模态LLMs研究提供了便利。
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年5月,动动鼠标就能让图片变「活」得研究DragGAN吸引了AI圈的关注。我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。更多技术细节和实验结果请参阅原论文。
比亚迪、腾讯联合出品!天文科普纪录片《外星连线》明日上线
快科技12月4日消息,比亚迪汽车官微刚刚宣布,比亚迪与腾讯视频联合出品的天文科普纪录片《外星连线》明日正式上线。官方尚未公布具体内容,但从文案和预热海报来看,应该会聚焦中国天眼”FAST射电望远镜。据悉,位于贵州平塘的中国天眼”FAST,是目前世界上最大、灵敏度最高的单口径射电望远镜,截至今年2月,它共观测发现740颗脉冲星。依靠它,我国探测宇宙天体�
中国助残志愿者协会联合无障碍智库全程指导,腾讯前海总部攻坚无障碍环境认证最高等级
2023年是《中华人民共和国无障碍环境建设法》立法实施之年,12月3日是第32个国际残疾人日。当天,腾讯公司发布官方视频,首度披露腾讯前海总部无障碍环境建设情况。本月下旬,在第18届中国信息无障碍论坛暨全国无障碍环境建设成果展示应用推广活动上,腾讯公司将联合中国助残志愿者协会以及无障碍智库单位——北京市建筑设计研究院有限公司、清华大学建筑设计研究
腾讯宣布与福佑卡车联合共创数字货运大模型
10月23日,腾讯与福佑卡车在腾讯北京总部大楼举行“数字货运大模型战略合作签约仪式”。双方将联合共创行业首个数字货运大模型,通过大模型技术的深度应用,共同推动数字货运实现运营效率和客户体验全面提升。利用大模型大数据分析技术,为物流需求预测和市场趋势分析提供有力支持,助力“福佑大脑”智能中台做出更明智的决策。
OPPO与支付宝成立联合创新实验室,持续构筑可信赖的互融生态
2024年1月11日,OPPO与支付宝成立联合创新实验室,双方将围绕泛在服务、安全能力、AIGC联合产品化和基础体验优化等四个模块展开合作,为用户打造安全可靠的产品和服务。2024年1月11日,OPPO与支付宝成立联合创新实验室针对用户高频场景,OPPO联合支付宝将继续扩大ColorOS泛在服务体验,覆盖出行、生活、餐饮、娱乐、就医、政务在内的六大场景。OPPO与支付宝也将持续构筑可信赖的互融生态,共同为用户打造全新的智慧服务体验。
上海AI实验室、Meta联合开发开源模型 可为人体生成3D空间音频
近期上海AI实验室与Meta合作推出的开源模型标志着在3D空间音频领域迈出的一大步。该模型通过处理头戴式麦克风的输入音频信号和分析人体姿态关键点,成功地实现了为人体生成3D空间音频的目标。未来仍需进一步优化和拓展,以满足更广泛的应用场景和设备要求。
深言科技联合清华大学NLP实验室开源LingoWhale-8B模型
深言科技与清华大学NLP实验室联合开源了LingoWhale-8B模型,这是一种拥有约80亿参数的中英双语大语言模型。该模型在多个公开评测基准上达到领先效果,在10B以下开源模型中表现出色。商业用途下需要申请并获得官方授权。
极空间AI实验室体验入口 AI搜索图像处理使用方法教程指南
极空间AI实验室 是北京天顶星智能信息技术有限公司推出的家庭私有云产品中的新功能。它包括自然语言搜索、相似图片搜索和图片文字识别等功能,旨在帮助用户更快捷地管理和使用存储在极空间中的图片。点击前往极空间AI实验室体验入口需求人群:适用于需要管理和快速检索大量图片的用户,如家庭用户、摄影师、设计师等。使用场景示例:使用自然语言搜索功能快速找
保时捷同款!小米汽车自建油泥造型实验室
快科技3月2日消息,小米汽车撰文称,为了打造高质量和好看的整车造型,小米自建油泥造型实验室。据了解,在汽车造型设计的全流程,是造型2D图纸-3D数模-油泥加工-油泥调型-逆向扫描-3D数模的正向逆向研发闭环。整个流程中,油泥模型的制作是非常关键的一步,通过对油泥模型的反复打磨和向数模模型的反推,才能诞生小米SU7的经得起时间考验的设计。对此,小米汽车投入了价值1500万 的世界顶级实验设备,组建了一个平均拥有12年经验的专家团队,做了全国唯一一个地下油泥造型实验室。实验室目前已经通过对油泥铣削审核认证。实验室中最核心?
阿里通义实验室开源多模态说话人项目3D-Speaker
3D-Speaker是通义实验室语音团队贡献的一个开源项目,结合了声学、语义、视觉三维模态信息来解决说话人任务。项目涵盖了说话人日志、说话人识别和语种识别任务,提供了工业级模型、训练代码和推理代码。3D-Speaker项目在说话人任务中探索了多模态信息的结合应用,提供了一系列有效的技术解决方案和开源资源,为语音研究领域的发展做出了贡献。
英伟达成立最壕AI实验室 专攻具身智能研究
英伟达最新宣布成立通用具身智能体研究小组,专注于发展具备理解、推理和与物理世界互动能力的智能系统。该研究小组由英伟达高级科学家JimFan和其队友YukeZhu共同领导,他们认为未来的移动机器人将成为自主体,如同iPhone般无处不在。他们之前在具身智能领域的研究成果已经引起广泛关注,未来的发展也备受期待。
娃哈哈成实验室“御用水”引热议 宗庆后曾回应:因为我们纯度高
2月25日,娃哈哈集团创始人、董事长宗庆后因病医治无效,在杭州逝世,享年79岁。人们用各种形式怀念宗庆后,话题娃哈哈实验室御用水”今日引起热议。部分实验偶尔用用可以。
上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)
InternLM-XComposer2是一款先进的视觉-语言模型,在自由组合文本和图像以及理解这两者之间的内容方面表现卓越。这款模型不仅超越了传统的视觉-语言理解能够巧妙地将多样化的输入,如概要、详尽的文本描述和参考图片,融合成包含文本和图像的复合内容,实现高度定制化的创作。这使得InternLM-XComposer2成为当前领先的视觉-语言模型之一,为多领域的创作和理解任务提供了卓越
GRUP MEDIAPRO宣布与微软成立AI合成媒体实验室
GRUPMEDIAPRO在ISE展会的框架内,宣布与微软合作,启动了一个人工智能和合成媒体实验室。这是两家公司为了为音像行业开发解决方案共享技术和商业知识的一个重要步骤。“有许多使用场景,可以让行业成员的任务变得更容易,让他们有更多的时间发挥创造力。
传音TECNO与杜比实验室合作 推进智能手机杜比全景声应用
传音旗下手机品牌TECNO与杜比实验室达成合作,共同推进杜比全景声空间音频体验在智能手机上的应用。TECNOPOVA6系列智能手机将率先搭载杜比全景声,并计划于2024年巴塞罗那世界移动通信大会上正式发布。MWC2024将于2月26日至29日在西班牙巴塞罗那举行,届时我们会跟进TECNOPOVA6系列智能手机的官方规格信息。
上海AI实验室开源科学大模型浦科化学,理科能力全线提升,免费商用
最新科学大模型浦科化学,发布即开源!这是上海AI实验室最新开源成果,它基于书生·浦语2.0强大的基座模型能力,通过注入海量化学专业数据,使大模型获得理解和处理化学相关专业任务的知识与能力。值得一提的是,在获得化学能力同时,大模型的数理学科及推理能力还得到增强。基于浦科化学模型,人工智能可为化学研究提供智能化辅助,如化学合成路径规划、化学反应条件优化、实验结果自动化分析等,从提升化学研究的效率和质量。
上海AI实验室等开源,音频、音乐统一开发工具包Amphion
上海AI实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为Amphion的音频、音乐和语音生成工具包。Amphion可帮助开发人员研究文本生成音频、音乐等与音频相关的领域,可以在一个框架内完成,以解决生成模型黑箱、代码库分散、缺少评估指标等难题。开发团队表示,未来,会持续更新这个工具包,加入更多与语音相关的模型,打造成最好用的开源语音工具包之一。
阿里巴巴通义实验室开源AI图像生成微调框架SCEdit
SCEdit是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队提出。该框架可以用于图像生成任务的微调,并支持快速迁移到特定的生成场景中。在可控生成任务中,SCEdit可以实现对生成结果的精准控制,并节省30%的内存使用。
百度拟将量子实验室捐赠予北京量子院:此前阿里达摩院已捐赠
快科技1月3日消息,我们获悉,百度拟将量子实验室及可移交的量子实验仪器设备等捐赠予北京量子信息科学研究院,目前双方正在推进具体细节。去年11月,阿里达摩院也将量子实验室捐赠予浙江大学。公开资料显示,2018年3月8日,百度宣布成立量子计算研究所,开展量子计算软件和信息技术应用业务研究,计划在五年内跻身世界一流,并逐步将量子计算融入到业务中。量子�