Machine Learning Engineering Guides and Tools

这个GitHub仓库名为“Machine Learning Engineering Guides and Tools”,由用户stas00 创建,是一个开放的集合,目的是提供成功训练大型语言模型(LLM)和多模态模型(VLM)的方法。它适用于LLM/VLM培训工程师和操作员,包含了实用的脚本和命令。仓库记录了作者在开源BLOOM-176B和IDEFICS-80B模型的训练过程中积累的经验,以及他们目前在Contextual.AI的工作。内容分为五个部分:关键组件、性能、操作、开发和其他主题,还包括了一些工具和指南的快捷方式​​。

参考