老潘的AI社区
LLM大模型训练技巧论文汇总
AI大模型
llm
imoldpan
2025 年2 月 18 日 13:54
1
强化学习范式OREAL:超越蒸馏,推动轻中量级模型突破推理“三重门”困局