休闲区 微软提出模型稀疏化新方法:单 GPU 就能压缩模型,性能不变参数少 25% 大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。今天要介绍的 SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练 0 137 0 Share