AI大模型

话题	回复	浏览量	活动
关于“AI大模型”类别	0	354	2023 年3 月 23 日
LLM的算法和工程，汇总篇	0	172	2025 年2 月 25 日
大模型模型推理加速相关技术汇总 cuda , llm , gpu , nvidia , tensorrt	0	4600	2023 年6 月 21 日
LLM评测指标相关总结 llm , opencompass	0	112	2025 年2 月 18 日
LLM大模型训练技巧论文汇总 llm	0	36	2025 年2 月 18 日
[vLLM vs TensorRT-LLM] #6. Weight-Only Quantization vllm , tensorrt-llm	2	111	2025 年2 月 24 日
[vLLM vs TensorRT-LLM] #5 Dynamic Sequence Lengths 动态序列长度讨论 vllm	2	116	2024 年12 月 25 日
Best Mac For Large Language Models llm , mac	0	1319	2024 年12 月 17 日
[vLLM vs TensorRT-LLM] #4 Which Scheduler Wins? 🔥 vllm , tensorrt-llm , llm	2	196	2024 年12 月 22 日
[vLLM vs TensorRT-LLM] #3 理解采样（Sampling）方法对两者性能的影响 vllm , tensorrt-llm	2	155	2024 年12 月 25 日
Little LLM量化思考量化 , llm	0	92	2024 年11 月 22 日
LLM Ops：大语言模型 (LLM) 的 GPU VRAM 需求计算 llm	0	158	2024 年11 月 20 日
Deploying LLMs with TorchServe + vLLM vllm	0	72	2024 年11 月 2 日
Pushing the Boundaries of Mixed-Precision LLM Inference With Marlin cuda , llm	0	138	2024 年10 月 29 日
[vLLM vs TensorRT-LLM] #2. Towards Optimal Batching for LLM Serving vllm , tensorrt-llm , llm	0	93	2024 年10 月 16 日
[vLLM vs TensorRT-LLM] 全面的评测 llm	0	355	2024 年10 月 8 日
大模型中的kv-cache llm , cache	0	4969	2023 年7 月 27 日
Best Practices for Tuning TensorRT-LLM for Optimal Serving with BentoML 翻译 , llm , tensorrt-llm	0	60	2024 年9 月 10 日
以LLAMA为例，快速入门LLM的推理过程 llama , nlp , llm	7	17536	2024 年8 月 13 日
大模型推理——FasterTransformer + TRITON tritonserver , llm , tensorrt-llm	0	1574	2023 年7 月 21 日
大模型中的量化量化 , llm	0	501	2023 年4 月 4 日
总结各种创作类型大模型生成式	0	464	2024 年1 月 11 日
免费大模型汇总 llm	0	625	2024 年3 月 7 日
上下文与RAG llm	0	348	2024 年2 月 18 日
Vision-Related LLM cv , llm	0	359	2023 年5 月 20 日
Code Gen 大语言模型 llm	1	338	2023 年8 月 25 日
大模型推理——分布式技术相关 mps , nccl , ray , llm	0	1733	2023 年7 月 20 日
大大大大大模型部署方案抛砖引玉 llm , tensorrt	0	2756	2023 年6 月 4 日
LLM推理框架之vLLM llm , vllm , 推理框架	0	5864	2023 年7 月 20 日
torch.distribute分布式系列 pytorch , distribute	0	303	2023 年8 月 8 日

关于“AI大模型”类别

0

354

2023 年3 月 23 日

LLM的算法和工程，汇总篇

0

172

2025 年2 月 25 日

大模型模型推理加速相关技术汇总

0

4600

2023 年6 月 21 日

LLM评测指标相关总结

llm , opencompass

0

112

2025 年2 月 18 日

LLM大模型训练技巧论文汇总

llm

0

36

2025 年2 月 18 日

[vLLM vs TensorRT-LLM] #6. Weight-Only Quantization

vllm , tensorrt-llm

2

111

2025 年2 月 24 日

[vLLM vs TensorRT-LLM] #5 Dynamic Sequence Lengths 动态序列长度讨论

vllm

2

116

2024 年12 月 25 日

Best Mac For Large Language Models

llm , mac

0

1319

2024 年12 月 17 日

[vLLM vs TensorRT-LLM] #4 Which Scheduler Wins? 🔥

vllm , tensorrt-llm , llm

2

196

2024 年12 月 22 日

[vLLM vs TensorRT-LLM] #3 理解采样（Sampling）方法对两者性能的影响

vllm , tensorrt-llm

2

155

2024 年12 月 25 日

Little LLM量化思考

量化 , llm

0

92

2024 年11 月 22 日

LLM Ops：大语言模型 (LLM) 的 GPU VRAM 需求计算

llm

0

158

2024 年11 月 20 日

Deploying LLMs with TorchServe + vLLM

vllm

0

72

2024 年11 月 2 日

Pushing the Boundaries of Mixed-Precision LLM Inference With Marlin

cuda , llm

0

138

2024 年10 月 29 日

[vLLM vs TensorRT-LLM] #2. Towards Optimal Batching for LLM Serving

vllm , tensorrt-llm , llm

0

93

2024 年10 月 16 日

[vLLM vs TensorRT-LLM] 全面的评测

llm

0

355

2024 年10 月 8 日

大模型中的kv-cache

llm , cache

0

4969

2023 年7 月 27 日

Best Practices for Tuning TensorRT-LLM for Optimal Serving with BentoML

翻译 , llm , tensorrt-llm

0

60

2024 年9 月 10 日

以LLAMA为例，快速入门LLM的推理过程

llama , nlp , llm

7

17536

2024 年8 月 13 日

大模型推理——FasterTransformer + TRITON

tritonserver , llm , tensorrt-llm

0

1574

2023 年7 月 21 日

大模型中的量化

量化 , llm

0

501

2023 年4 月 4 日

总结各种创作类型大模型

生成式

0

464

2024 年1 月 11 日

免费大模型汇总

llm

0

625

2024 年3 月 7 日

上下文与RAG

llm

0

348

2024 年2 月 18 日

Vision-Related LLM

cv , llm

0

359

2023 年5 月 20 日

Code Gen 大语言模型

llm

1

338

2023 年8 月 25 日

大模型推理——分布式技术相关

mps , nccl , ray , llm

0

1733

2023 年7 月 20 日

大大大大大模型部署方案抛砖引玉

llm , tensorrt

0

2756

2023 年6 月 4 日

LLM推理框架之vLLM

llm , vllm , 推理框架

0

5864

2023 年7 月 20 日

torch.distribute分布式系列

pytorch , distribute

0

303

2023 年8 月 8 日