DeepSeek - AI资讯 | 嬴政天下

DeepSeek-V2聊天机器人爆火：国产AI性能直追GPT-4o

中国AI公司DeepSeek推出V2模型聊天机器人，免费开放使用，其中文能力媲美GPT-4o，在编程和数学领域表现出色。一天内X平台中文讨论超10万，转发量领跑，凭借高性价比迅速引爆中国AI圈，标志着国产大模型崛起。

DeepSeek Inference 5.1 基准测试全解析

DeepSeek Inference 5.1 是DeepSeek最新发布的推理引擎，在 MLCommons 推理基准中表现出色。该版本针对大模型高效推理进行了优化，支持 SGLang 等框架，显著提升了吞吐量和延迟性能。测试数据显示，在 Llama 3.1 405B 等模型上，DeepSeek Inference 5.1 的性能超越了 vLLM 和 TensorRT-LLM 等竞品，Elo Rating 排名前列。文章详解其关键特性、基准结果及实际部署建议，助力开发者选择最佳推理方案。（128字）

GB200 NVL72部署DeepSeek优化（二）：预填充3.8倍、解码4.8倍吞吐量

GB200 NVL72作为深度学习最强硬件之一，本文分享SGLang团队在上篇博客基础上，对DeepSeek V3/R1推理性能的进一步优化，包括FP8 attention、NVFP4 MoE、大规模专家并行（EP）、预填充-解码分离等技术。在FP8 attention和NVFP4 MoE下，SGLang实现每GPU预填充26,156 tokens/s、解码13,386 tokens/s（2000 token输入），较H100提升3.8倍和4.8倍。即使采用传统BF16 attention和FP8 MoE，也达18,471和9,087 tokens/s。优化涵盖低精度计算、更快内核集成、计算通信重叠等，精度损失微乎其微。实验验证了端到端性能大幅提升，并分析了内核级加速效果。（128字）

DeepSeek (共7篇)

DeepSeek-V2聊天机器人爆火：国产AI性能直追GPT-4o

DeepSeek Inference 5.1 基准测试全解析

GB200 NVL72部署DeepSeek优化（二）：预填充3.8倍、解码4.8倍吞吐量

DeepSeek-V2中文能力超GPT-4o：中国开源AI高效新突破

DeepSeek-V2中文基准超GPT-4o：中国开源AI高效突破

DeepSeek-V2发布：中文数学推理超GPT-4o，236B参数高效领先

DeepSeek-V3开源聊天模型强势挑战Claude 3.5：性能逼近、免费开放引爆中文社区