可在图像中生成任意精准文本,支持中文!阿里开源AnyText
随着Midjourney、StableDifusion等产品的出现,文生图像领域获得了巨大突破。但是想在图像中生成/嵌入精准的文本却比较困难。AnyWord-3M吸取了多个数据集的精华中的精华,也是AnyText能力非常强悍的重要原因之一。
智源联合共建单位开源可信中文互联网语料库CCI
智源研究院联合拓尔思、中科闻歌共建了“中文互联网语料库”,旨在为大数据和人工智能行业提供安全、可靠的语料资源。该语料库经过严格的筛选和清洗,包括基于规则和模型的过滤,以及针对评测数据集的严格过滤。智源研究院还开放了其他高质量中文数据集,如WUDAOcopora、COIG和MTP。
vivo自研70亿蓝心大模型7B开源:中文能力国内第一 最适合中国开发者
今天,2023年vivo开发者大会如期在深圳举行,在发布会上,vivo正式发布了旗下的自研通用AI大模型矩阵蓝心大模型。此次发布的蓝心大模型共包含5款,包括10亿蓝心大模型1B、70亿蓝心大模型7B、700亿蓝心大模型70B、1300亿蓝心大模型130B和1750亿蓝心大模型175B,全面覆盖各种使用场景。根据官方介绍,70亿蓝心大模型7B主要是面向手机打造的端云两用模型,在语言理解、文本创作等场景下表现都非常优秀。