量化精度选择 FP8和INT8?

理论算力注意

4090算力

参考