大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。作者已经放出了所有代码,并将所有模型和实验脚本开源。
中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT
中科大和IDEA研究院封神榜团队合作开发了一款名为ChiMed-GPT的中文医疗领域大语言模型。该模型基于封神榜团队的Ziya2-13B模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的需求。该模型不仅能够有效处理医疗文本数据能生成适合回答患者咨询的内容。