小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
对于2023年的计算机视觉领域来说,「分割一切」是备受关注的一项研究进展。Meta四月份发布的「分割一切模型」效果,它能很好地自动分割图像中的所有内容SegmentAnything的关键特征是基于提示的视觉Transformer模型,该模型是在一个包含来自1100万张图像的超过10亿个掩码的视觉数据集SA-1B上训练的,可以分割给定图像上的任何目标。图3、4、5提供了一些定性结果,以便读者对Effic