性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight
【新智元导读】SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从辅助表征高效地提取到长期未来信息。马尔科夫决策过程在具体分析两种结构性信息之前,我们先介绍产生状态序列的马尔科夫决策过程的相关定义。,使预测器的输出能逼近真实状态序列的傅里叶变换,从鼓励表征编码器提取�