现代激情华泰证券：DeepEP开源有望开释推理需求真贵哄骗与算力

发布日期：2025-06-29 16:00 点击次数：200

　　华泰证券以为，DeepSeek通过优化推理本钱，有望鼓舞LLM买卖化哄骗加快。基于此现代激情，看好推理需求开释带动IaaS奇迹商稼动率进步，云厂商有望受益。其次，议论到R1带来模子技艺进步的同期又可达成低本钱部署，有望带动AI哄骗加快渗入。临了，尽管现在DeepEP仍需要在Hopper+CUDA+NVLink的框架下达成，但中恒久来看，跟着国产卡的适配跟进，手艺有望向更多国产生态迁徙，国产AI算力板块有望迎来成长机遇。

　　全文如下

　　华泰 | 计较机：DeepSeek - EP降本，真贵哄骗与算力

　　2025年3月1日，DeepSeek发布《One More Thing， DeepSeek-V3/R1 Inference System Overview》，其中提到通过大模子跨节点众人并行，DeepSeek达成了$87，072/天的低本钱推理，有用算力取得显贵进步。咱们以为，跟着国产算力硬件徐徐适配DeepEP体系，DeepSeek模子或通过性价比上风带动推理需求开释，国产算力有望加快成长。

在线ps

　　中枢不雅点

　　中枢亮点：推理本钱大幅裁汰，理念念情状下15%付费率即可盈亏平衡

　　据DeepSeek，V3和R1推理奇迹占用节点总数，峰值占用为278个节点，平均占用226.75个节点，DeepSeek假设GPU租出本钱为2好意思金/小时，总本钱为$87，072/天。此外，在2025/02/27 12:00 PM至2025/02/28 12:00 PM，V3和R1模子推理浪掷Token 776B（输入608B+输出168B），平均每百万Token惩办本钱为0.11好意思元。DeepSeek假设若是扫数Tokens一谈按照DeepSeekR1的订价计较，表面上一天的总收入为$562，027，本钱利润率545%。但议论到现在DeepSeek仅通过API收费，梓乡们测算若按照R1收费订价，付费Token占总Token的15%即可达成推理历程的盈亏平衡。

　　中枢手艺：通过EP达成更高的抵赖量和更低的蔓延

　　DeepSeek-V3 / R1 推理系统的优化主义是：更大的抵赖，更低的蔓延。为了达成这两个主义，DeepSeek的决策是使用大领域跨节点众人并行（Expert Parallelism/EP），并开源了DeepEP代码。具体来看，中枢技艺包括：1）大领域跨节点众人并行：罗致了预填充-解码领会架构，不同阶段同期进行多个众人并行计较；2）计较/通讯近似：将GPU中的SM（流多惩办器）分别为计较、通讯两部分，各自同期推论相应责任负载，减少蔓延恭候期间；3）负载平衡：通过预填充负载平衡、解码负载平衡、众人并行负载平衡，尽可能地为每个 GPU 分派平衡的计较负载、通讯负载。

　　中枢原因：推理订价/本钱的互异或为外部算力供应受限的限度

　　对比来看，国外模子如OpenAI o3-mini在推理订价方面较DeepSeek更贵，如每百万Token输入的价钱为$0.55（缓存射中），而R1为$0.14。咱们以为，API订价的互异或有至极一部分来自于推理本钱的互异，DeepSeek或凭借EP等更极致的软硬件优化，达成推理本钱的从简。咱们以为，这一景色的背后，反应的是国表里算力供应以及产业所在的互异。国内大模子厂商在算力供给受限的布景下，通过手艺优化的形势不休压榨硬件性能，在有限的算力下达成最优的模子后果。基于此，咱们以为，国内模子有望凭借性价比上风，带动卑劣买卖化哄骗，达成群众市集的份额进步。

　　中枢受益：DeepEP开源有望开释推理需求，真贵哄骗与算力

　　咱们以为，DeepSeek通过优化推理本钱，有望鼓舞LLM买卖化哄骗加快。基于此，咱们看好推理需求开释带动IaaS奇迹商稼动率进步，云厂商有望受益。其次，议论到R1带来模子技艺进步的同期又可达成低本钱部署，有望带动AI哄骗加快渗入。临了，尽管现在DeepEP仍需要在Hopper+CUDA+NVLink的框架下达成，但中恒久来看，跟着国产卡的适配跟进，手艺有望向更多国产生态迁徙，国产AI算力板块有望迎来成长机遇。

　　风险提醒：AI手艺迭代不足预期；AI买卖化不足预期；本陈说基于客不雅信息整理现代激情，不组成投资提出。

上一篇：jav 国产特朗普：数千乌军被包围浓烈条款普京饶他们一命！俄称又规复一地乌方强制8个假寓点住户疏散！俄罗斯股市直线拉升

下一篇：ai换脸刘亦菲现货黄金刷新日高至2953.90好意思元

现代激情 华泰证券：DeepEP开源有望开释推理需求 真贵哄骗与算力

现代激情华泰证券：DeepEP开源有望开释推理需求真贵哄骗与算力