HuggingFace推出最大的开放合成数据集Cosmopedia 250亿个tokens
HuggingFace推出了Cosmopediav0.1,这是最大的开放合成数据集,由Mixtral7b生成,包含超过3000万个样本,总共约250亿个标记tokens。数据集旨在通过映射来自网页数据集如RefinedWeb和RedPajama的信息来汇编全球知识,包括教科书、博客文章、故事和WikiHow文章等各种内容类型。其目标是通过量身定制提示风格和受众,最大程度地提高多样性,从显著减少重复内容。
同比暴增超850%!TCL科技2023年预计净利润21-25亿元
快科技1月29日消息,近日,TCL科技发布了2023年度业绩预告,预计全年归属于上市公司股东净利润将达到21-25亿元,同比暴增704%-857%。报告表示,公司预计2023年收入1735.5亿元-1773.5亿元,同比增长4%-6%。据了解,TCL科技的主营包括半导体显示和新能源光伏两大业务,其中半导体显示业务的运营主体为TCL华星。TCL表示,此次净利润的大增主要来源于面板行业的回暖,大尺寸面板行业�