这个春节,DeepSeek R1 出圈,DAU 直接突破 1000 万,达到了 ChatGPT 的 23% 的水平。

image.png

春节假期都快过去了,DeepSeek 官网依然是各种「服务器繁忙,请稍后再试」,大家对 R1 的需求实在是太强太强了。

可以预料到的是,开工之后,企业客户对 R1 模型的需求也会爆发性增长,而在相当长的一段时间里难以满足,满满的都是商机。

好在 R1 是个开源模型,腾讯云在2月2号就支持了 R1 各个版本的一键部署。

今天就以腾讯云为例,为大家介绍一下 DeepSeek R1 满血版的云端部署指南。

不管是公司自用,还是为客户提供服务,都值得参考。

R1 满血版和蒸馏版的区别

首先要讲一下为什么 R1 会分为满血版和蒸馏版。

R1 满血版,就是 671B 版本,通过 RL 训练出来的,也就是 DeepSeek 官网提供的版本,模型能力达到了 o1 水平,模型部署的硬件要求也很高。

R1 蒸馏版,是1.5B到70B之间的数个版本,是 DeepSeek 为了研究 RL 泛化能力而基于 Qwen 和 Llama 的开源模型,用 SFT 蒸馏出来的版本,模型能力虽然不如满血版,但是对硬件要求极低,指标上在同规模的开源模型里也是非常领先的。

具体的指标见下表:

image.png

DeepSeek R1 部署流程。

了解完 R1 满血版和蒸馏版的区别,接下来让我们一起来看看具体的部署流程吧。

1.首先打开腾讯云TI平台

网址:https://cloud.tencent.com/product/ti

打开网址后,点击首页的【立即使用】