海通缱绻机|DeepSeek初探:从V3到R1,高性能+廉价钱大开全新AI发展范式,鼓舞AI在办公、锤真金不怕火、医疗世俗利用
发布日期:2025-03-14 09:59 点击次数:78专题:DeepSeek为何能调度大众AI圈
起原:海扫数考

杨林
海通缱绻机首席分析师
S0850517080008
DeepSeek热度高潮,在168国度位居下载榜第一。近期,DeepSeek的热度居高不下。日前,英伟达、微软、亚马逊等AI巨头纷繁告示,已接入DeepSeek。DeepSeek在2024年12月26日推出V3模子(对标GPT4 o),因其权贵的性能,用户马上运转增长,在1月20日发布R1模子(对标 OpenAI o1)后,进一步出圈。把柄七麦数据,罢休1月30日,DeepSeek在168个国度位居下载榜第别称。1月24日,著名投资公司A16z的首创东说念主马克·安德森发文称,Deepseek-R1是他见过的最令东说念主咋舌、最令东说念主印象深刻的突破之一,而且还是开源的,它是给天下的一份礼物。DeepSeek日前最新开源模子DeepSeek-R1,用较低的成本达到了接近于OpenAI o1的性能。这一发达破解了大众AI产业长久以来“堆算力”的旅途依赖,其影响也进一步涉及了成本阛阓。
DeepSeek-V3:极低检修成本带来强劲性能。2024年12月16日,DeepSeek全新系列模子 DeepSeek-V3 首个版块上线并同步开源。DeepSeek-V3是一个大型夹杂大家(MoE)模子,领有671B参数,其中每个token激活37B。DeepSeek把柄一系列全面的基准测试对DeepSeek-V3进行了评估。尽管检修成本不高,但全面的评估标明,DeepSeek-V3-Base已成为彼时最精深的开源基础模子,何况在一系列范例和怒放式基准测试中达成了与卓绝的闭源模子(包括GPT-4o和Claude-3.5-Sonnet)绝顶的性能。DeepSeek-V3的完好意思检修仅破耗278.8万GPU小时。假定H800 GPU的租借价钱为每GPU小时2好意思元,DeepSeek-V3的总检修成本仅为557.6万好意思元。
DeepSeek-R1:调动推理范式+强化蒸馏成果。1月20日,DeepSeek-R1认真发布,其在后检修阶段大范围使用了强化学习本事,在仅有小数标注数据的情况下,极大升迁了模子推聪敏力。在数学、代码、当然话语推理等任务上,性能并列OpenAI o1郑再版。DeepSeek通过DeepSeek-R1的输出,蒸馏了6个小模子开源给社区,其中32B和70B模子在多项智力上达成了对标OpenAI o1-mini的成果。此外,DeepSeek-R1降服MIT License,允许用户通过蒸馏本事借助R1检修其他模子。DeepSeek-R1 API做事订价为每百万输入tokens 1元(缓存掷中)/4元(缓存未掷中),每百万输出tokens 16元,在现在主流o1类推理模子中订价最低。对比来看,OpenAI o1每百万输出tokens 438元,是DeepSeek-R1的27倍以上。
咱们觉得,DeepSeek系列模子的共通之处在于,齐在凭借对算法、框架和硬件的协同优化,大幅镌汰了检修与使用成本,同期保管了行业顶尖的性能水平,使其在性价比上远超同类竞品。非凡是 DeepSeek-R1,借助蒸馏本事达成了低参数、低成本与高性能的和洽,这无疑将鼓舞 AI 在办公、锤真金不怕火、医疗等繁密规模的世俗利用。这些历程蒸馏管制的轻量化模子,纰漏松驰进行端侧部署。值得一提的是,DeepSeek 的开源政策对 AI 利用产生了深切影响,突破了少数企业的本事把持,激勉了其他企业和科研机构的本事调动与探索温煦,鼓舞了AI本事的快速发展。转头来说,DeepSeek的系列模子正在通过高性能+廉价钱的格式大开全新的AI发展范式,AI全面落地的时间也在有望其的鼓舞下加快到来。
风险指示。AI本事发展不足预期,AI生意落地不足预期,阛阓竞争加重的风险。
本纲目选自海通证券盘考所盘考论说:海通缱绻机 | DeepSeek初探:从V3到R1,高性能+廉价钱大开全新AI发展范式
对外发布时分:2025年2月7日
MACD金叉信号酿成,这些股涨势可以!
牵扯剪辑:常福强