满血版 deepseek-R1, 参数 671B,理论上需要 350G 以上显存/内存才能够部署 FP4 的量化版本。对于家用电脑来说,这是不可能的,即使采用压缩、分层等优化方法,使用最新的 Nvidia RTX5090 显卡(32G 显存),每秒低于 10tokens 的推理输出速度不具备实用价值。普通人能实际部署的仅仅是 Deepseek-R1-distill 蒸馏版模型,这是大家可以真正用得上的版本;模型大小从 1.5B 到 70B 都有。那么问题来了,普通人为什么要部署呢?作者是没有“雅兴”在自己电脑上部署大模型的,而之前采用 tencent cloud studio 部署的最大尺寸就是 14b,距离“白嫖”上 671b 满血版本还差得远。
在线使用方面,deepseek 官方频繁提示“服务器繁忙,请稍后再试”并且停止了 API 充值,普通用户使用 API 可以是解决在线翻译、本地 UI 调用等需求的,好在 Deepseek-R1 是开源的,那我们就来看看哪些地主家有余粮(显卡/计算卡),要求当然是提供全尺寸 R1 模型的推理服务和一定的免费 API 额度。
Nvidia
Nvidia 要是没余粮了,那其他家就更不可能有余粮了。无需注册,打开「Nvidia NIM Deepseek-R1」就可以在网页端直接使用上满血版的 deepseek r1 推理服务了,「Nvidia NIM Deepseek-R1」是当下最稳定、响应最快的平台,没有之一。目前,匿名用户使用 deepseek r1 会存在排队现象,但一般不会超时。本文示例在不进行注册登录的前提下,对话排序为第 149(line 149),发送问题到实际输出显示的等待时间约 10 秒,老黄家的余粮一定是最充足的。
![图片[1]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c3301f0a88a4e8ee5c62d.webp?size=1752x1076)
作为测试对比,在 deepseek 官方 api 调用出现错误的情况下,匿名状态在网页端翻译本文标题,没有任何排队等待,使用下文的硅基流动 api 也很慢,某为不是纯国产不受任何制约吗?舍不得堆量!登陆后同样使用 nvidia nim 提供的 api 也没有报错,并且响应输出快速。
![图片[2]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c330155562d0e8240946f.png?size=998x526)
Nvidia 提供免费免注册的在线全尺寸 deepseek r1 推理服务的同时,也可以注册 nvidia nim 账号以使用 api,注册用户赠送 5000 点积分。在右侧 api 调用代码区,可以直接使用给出的 base_url(https://integrate.api.nvidia.com/v1/chat/completions),api_key 则可以通过点击右上方的『Get API Key』进行注册并创建。
![图片[3]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c3301bd156cf34de7cbce.webp?size=1079x344)
点击页面右上角的『Login』或右侧的『Get API Key』,都可以打开注册界面。输入电子邮箱开始注册,注册过程参考「视频分享」。
![图片[4]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c33015a5de5646d51486c.webp?size=1103x620)
完成注册后,将获得 1000 点积分,使用企业邮箱、额外填写企业信息,进一步获得 4000 点积分,也就是说,普通用户通常可以获得 5000 点积分。企业信息的角色、行业等都可以随意填写,但建议尽量保证企业名称的真实性。填写完成之后点击『Continue』就可以完成填报,会自动进行验证、积分增加和页面重定向。
![图片[5]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c3301a9e4a6340ba45912.jpg?size=1224x986)
接下来,就可以将创建 API key 并在相关应用中使用。本文以沉浸式翻译为例,打开设置后,选择『翻译服务』,不要下拉选择 deepseek,而应该点击顶部的添加OpenAI兼容服务。
![图片[6]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c3301ca90fc0d524ab769.webp?size=1452x595)
在自定义 AI 设置页面,关键信息如下:
API 接口地址(Base_url):https://integrate.api.nvidia.com/v1/chat/completions
API KEY:你的 api key
模型(Model name):deepseek-ai/deepseek-r1
![图片[7]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c33010fd0cc31e8b9e409.webp?size=957x662)
填写完毕之后,可点击页面顶部右侧的『点此验证服务』进行验证,填写无误的情况下,都会验证成功。接下来,就可以无视 deepseek 官方抽疯,继续爽玩全尺寸 deepseek-r1 了。
硅基流动
硅基流动是一家中国 AI 公司,自 deepseek 2.5 时代就广为人知,提供有平价 API 接入,并且一直有注册送 2000万 tokens 的活动,额外还有邀请推广机制(邀请新用户注册送 2000 万 tokens)。硅基流动和华为合作,由华为昇腾提供算力支持提供满血版的 Deepseek-R1 推理服务。
硅基流动采用邀请推广方式,邀请者和受邀请用户都可以获赠 2000 万 Tokens。有需要的可以点击作者的邀请链接。
💎「硅基流动赠送 2000 tokens 的邀请链接」💎
![图片[8]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c330122341e882daba0d3.webp?size=2233x296)
新用户注册后,即进入首页的模型广场,顶部的 deepseek r1/v3 都是全量 671b 模型,任选其一,直接点击即开进入对话模式。
![图片[9]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c3301b9a7bae5326d3354.webp?size=2492x1287)
点开左侧『余额充值』即可查看到赠送的等值 14 元赠金,在『API 密钥』页面可以创建 API Key,用于翻译、编程等工具的远程调用。
![图片[10]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c3301a8c9a54f6106d0c8.webp?size=827x721)
在线体验也是需要消耗 token 的,不过硅基流动一直是平价的,并且可以观察到推理过程是不计费的。
![图片[11]-普通人如何免费用上满血版Deepseek-R1-绿软否](https://p0.ssl.img.360kuai.com/t11fd4c330152eb50aa1f49b2dc.webp?size=1454x1260)
硅基流动的 API 接入可参考官方文档,这里不做赘述。
其他
其他仅提供了非独家 API 接入的平台这里不做详细介绍,为什么?因为所有人都可以接入某个平台,并不需要持有或独占算力。国内可直连访问、提供 deepseek r1 推理服务的平台还包括以下机构:
- Azure AI -全尺寸模型,Azure 账号注册有一定门槛,「Model catalog」中选择 deepseek r1 即可,可使用新用户赠金;
- AWS Bedrock-全尺寸模型,持自定义模型导入,灵活性高,可使用新用户赠金;
- 火山方舟-全尺寸模型,新用户注册赠送 50万 tokens,推理(<think></think>包裹的部分)不计费;
- 秘塔AI-接入全尺寸 deepseek-r1 模型,可打开『长思考-R1』启用深度思考推理模式;
- 百度智能云-限时 5 折,完全蹭热度,毫无吸引力;
- 其他-很多 oneman 搭建的平台,鱼龙混杂,远离。
国外还有一些提供免费全尺寸 deepseek r1 推理服务和 api 接入的平台,考虑到可访问性,本文不做列举,后续在进行介绍和演示。需注意的是,Nvidia、Azure、AWS 都不建议使用代理访问,有时不经意没有关闭代理的情况下,会出现一些莫名其妙的问题。



![HoneySelect 2 DX BetterRepack R5汉化破解版下载+Honey Select2人物mod大全下载[104.53G]-绿软否](https://p0.ssl.img.360kuai.com/t01428da921eb902963.jpg?size=2560x1440)















私信时间

暂无评论内容