当前标签

稀疏

微软提出模型稀疏化新方法:单 GPU 就能压缩模型,性能不变参数少 25%

大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。今天要介绍的 SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练

微信扫一扫

微信扫一扫
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close