老潘的AI社区
Little LLM量化思考
AI大模型
量化
,
llm
imoldpan
2024 年11 月 22 日 02:33
1
小规模 LLM量化思考
参考
Performance of Quantized Models - Qwen
https://huggingface.co/neuralmagic/Qwen2-0.5B-Instruct-FP8