这里汇总关于量化的一些知识
开源量化框架
- GitHub - ModelTC/MQBench: Model Quantization Benchmark
- GitHub - openppl-public/ppq: PPL Quantization Tool (PPQ) is a powerful offline neural network quantization tool.
- https://github.com/ModelTC/Dipoorlet
模型量化情况
可以重点参考:
大模型量化
大模型量化与小模型的方案不同
bert量化