老潘的AI社区
Little LLM量化思考
AI大模型
llm
,
量化
imoldpan
2024 年11 月 22 日 02:33
1
小规模 LLM量化思考
参考
https://qwen.readthedocs.io/en/latest/benchmark/quantization_benchmark.html
https://huggingface.co/neuralmagic/Qwen2-0.5B-Instruct-FP8