文章来源：硬AI

AI“快进”到价格战阶段？从Deepseek-V2定价看大模型降本新风向

图片来源：由无界AI生成

卷价格的风还是吹到了AI大模型。

近日，大模型DeepSeek-V2将每百万tokens输入/输出价格分别卷至1/2元，远低于行业平均水平。

对此，华福证券发布报告称，大模型成本优化与算力需求并不是直接的此长彼消，而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地，进而会衍生出更多的微调及推理等需求，将逐步盘活国内AI应用及国产算力发展。

DeepSeek-V2是知名私募巨头幻方量化旗下AI公司深度求索（DeepSeek）发布的全新第二代MoE大模型。

华尔街见闻此前文章提到，DeepSeek-V2拥有2360亿参数，其中每个token210亿个活跃参数，相对较少，但仍然达到了开源模型中顶级的性能。

华福证券则在报告中写道，从综合性能方面来看，DeepSeek-V2位列第一梯队。在AlignBench、MT-Bench、MMLU等多个benchmark上表现出色，其中AlignBench在开源模型中居首位，与GPT-4-Turbo，文心4.0比肩。MTBench超过最强MoE开源模型Mixtral 8x22B。

01 DeepSeek-V2定价将至冰点

大模型价格战拉开序幕

DeepSeek-V2（32k）每百万tokens输入/输出价格分别为1/2元，而GPT-4-Turbo-1106分别为72/217元，DeepSeek-V2性价比显著。

相对于Claude 3 Haiku，DeepSeek-V2每百万tokens输入/输出价格也仅为其50%/22.2%。除此之外，同为32k上下文版本的moonshot-v1、SenseChat-32K、Qwen1.5 72B每百万tokens输入/输出价格分别为24/24、36/36、20/20元。

DeepSeek表示，采用8xH800 GPU的单节点峰值吞吐量可达到每秒50000多个解码token。如果仅按输出token的API的报价计算，每个节点每小时的收入就是50.4美元，假设利用率完全充分，按照一个8xH800节点的成本为每小时15美元来计算，DeepSeek每台服务器每小时的收益可达35.4美元，甚至能实现70%以上的毛利率。

有分析人士指出，即使服务器利用率不充分、批处理速度低于峰值能力，DeepSeek也有足够的盈利空间，同时颠覆其他大模型的商业逻辑。

华福证券也认为，此次DeepSeek-V2定价发布有望掀起新一轮大模型价格战，api定价有望持续走低。