大模型要占你多少内存？这个神器一键测量，误差低至0.5MB，免费可用

Question

原文来源：量子位![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-afe64e4d75-dd1a6f-1c6801)图片来源：由无界 AI‌ 生成大模型训练推理要用多少内存？打开这个网页一测便知，测量误差小至0.5MB。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-003d65f75d-dd1a6f-1c6801)比如模型bert-base-case Int8估计占用**413.18 MB**内存，实际占用为**413.68MB**，**相差0.5MB**，误差仅有**0.1%**。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4762b52817-dd1a6f-1c6801)操作也很简单，输入模型名称，选择数据类型即可。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-dae5ed525a-dd1a6f-1c6801)这就是HuggingFace Space上的最新火起来工具——**Model Memory Calculator**，模型内存测量器，在网页端人人可体验。要知道，跑大模型最头疼的问题莫过于：GPU内存够吗？现在能先预估一波、误差很小，让不少人大呼“Great”！![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d783a9de33-dd1a6f-1c6801)  ## **实际推理内存建议多加20%**  使用第一步，需要输入模型的名称。目前支持搜索在HuggingFace Transformers库和TIMM库中的模型。比如想要看GLM-6B的情况，可以输入“**THUDM/chatglm-6b**”。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d51ed5f98e-dd1a6f-1c6801)不过有一些模型会存在限制，需要获取API token后才能开始计算，比如Llama-2-7b。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7acb634ee0-dd1a6f-1c6801)我们找了几个大模型实测，可以看到当模型规模达到百亿参数后，内存要求被直线拉高。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-09b59ddfae-dd1a6f-1c6801)基础版的BERT还是对GPU相当友好滴![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f13ae11b24-dd1a6f-1c6801)。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b0effe01fa-dd1a6f-1c6801)而在实际推理过程，EleutherAI发现需要在预测数据基础上，**预留20%的内存**。具体举例如下：![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-515681dd6b-dd1a6f-1c6801)  ## **作者小哥热衷开源项目**  最后来介绍一下带来这个项目的小哥**Zach Mueller**。他本科毕业于西佛罗里达大学，主修软件设计与开发，热衷开源，在GitHub有1k粉丝。之前做过很多和Fast.ai框架有关的开源项目。![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-139fa912cf-dd1a6f-1c6801)传送门：