阿里通义实验室开源多模态说话人项目3D-Speaker
3D-Speaker是通义实验室语音团队贡献的一个开源项目,结合了声学、语义、视觉三维模态信息来解决说话人任务。项目涵盖了说话人日志、说话人识别和语种识别任务,提供了工业级模型、训练代码和推理代码。3D-Speaker项目在说话人任务中探索了多模态信息的结合应用,提供了一系列有效的技术解决方案和开源资源,为语音研究领域的发展做出了贡献。
上海人工智能实验室最新项目PIA放出演示 可将写实照片转换成3D动漫效果
上海人工智能实验室最新的项目PIA已经放出演示,该项目通过文本控制图片中的内容来生成视频。它可以将写实的照片转换成偏3D动漫的效果。用户可以根据自己的需求定制图像动画效果,让用户能够通过图像传达自己独特的故事和情感。
阿里通义XR实验室开源文生3D模型
阿里通义实验室XR实验室开源了文生3D新模型,可以通过一句文本描述生成对应的3D模型及纹理。开源的模型包括Text-to-ND和Text-to-ND-MV两个大模型。还同步开源了从大模型中蒸馏出3D模型的优化代码,串联可以完成文本直接到3D模型的生成。
世界品牌实验室2023年世界品牌500强发布:华为排中国第五
由世界品牌实验室独家编制的2023年度《世界品牌500强》排行榜于12月13日在美国纽约揭晓。美国在500强中占据193席,稳居品牌大国第一。市场占有率、品牌忠诚度和全球领导力是关键指标。
上海AI实验室、Meta联合开发开源模型 可为人体生成3D空间音频
近期上海AI实验室与Meta合作推出的开源模型标志着在3D空间音频领域迈出的一大步。该模型通过处理头戴式麦克风的输入音频信号和分析人体姿态关键点,成功地实现了为人体生成3D空间音频的目标。未来仍需进一步优化和拓展,以满足更广泛的应用场景和设备要求。
荣耀绿洲护眼实验室成立:未来3年将投入10亿 研发费用
快科技11月16日消息,荣耀今日举行了荣耀全新护眼技术沟通会,并且宣布成立荣耀绿洲护眼实验室。据介绍,荣耀绿洲护眼实验室在与10研究机构联合,拥有100护眼相关专利的基础上,未来3年将投入10亿 研发费用,坚持人因化、专业化、标准化的研究新方向。同时,荣耀将在护眼标准和评价体系建设、眼健康和生物医学、先进屏幕技术、科研与学术单位合作四大领域,携手同�