20倍的压缩比例!微软发布LLMLingua:压缩长提示并加快模型推理速度
微软的研究团队开发了一种名为LLMLingua的独特粗细压缩技术,旨在解决大型语言模型中长提示带来的问题。LLMs以其强大的泛化和推理能力显著推动了人工智能领域的发展,展示了自然语言处理、自然语言生成、计算机视觉等方面的能力。该方法表现出色,并提供了一种改善LLM应用程序的效果和可负担性的有用方式。