DeepSeek-R1:70B¶
在这篇文章中
信息
DeepSeek-R1:70B 是一个拥有 700 亿参数的高级语言模型,专为通过 Ollama 框架进行高性能任务和本地部署而设计。它结合了卓越的表达能力、对复杂推理的支持,以及通过 Open Web UI 实现的轻松集成。为了有效运行,该模型需要强大的计算资源——具体来说是支持 FP16/INT4 的 NVIDIA 现代 GPU 或兼容的加速器。建议在 Ubuntu 22.04 或更高版本的操作系统上部署,以确保大模型的稳定运行。
DeepSeek-R1:70B 的主要功能¶
- 高性能:得益于其拥有 700 亿参数的庞大架构,DeepSeek-R1:70B 在自然语言生成和理解方面表现出色,即使在复杂场景下也能确保响应的准确性和深度;
- 多语言支持:该模型在广泛的多语言语料库上进行了训练,能够自信地处理数十种语言,包括俄语、英语、中文、西班牙语、法语等;
- 高级推理模式:支持 zero-shot(零样本)、few-shot(少样本)和 chain-of-thought(思维链)推理,无需进一步训练即可解决复杂的逻辑、分析和创造性任务;
- 应用广泛:DeepSeek-R1:70B 高效处理各种任务——从生成艺术和技术文本到编写和调试代码、解决数学问题以及分析结构化数据;
- 深度集成:该模型可以通过 REST API 轻松连接到外部系统,或嵌入到聊天机器人、分析平台、IDE 和企业应用程序中;
- 微调与适应能力:支持针对特定领域(如医学、金融、法律、工程和科学研究)的微调和 LoRA 适配;
- 合乎伦理且可靠:内置过滤有毒、有害或有偏见内容的机制,符合负责任的 AI 现代标准;
- 针对本地使用优化:尽管规模庞大,DeepSeek-R1:70B 支持量化(例如低至 4 位),使其能够在 GPU 内存有限的服务器上运行,而不会造成关键的质量损失;
-
处理异构数据:该模型不仅高效处理标准文本,还能处理编程代码、表格、JSON、XML 和其他格式,使其成为数据科学和自动化中的宝贵工具;
-
使用示例:
- 智能客户支持:实时生成个性化、上下文相关的响应;
- 教育与科学:协助解决复杂问题、解释概念、生成教育材料;
- 内容与营销:创作创意文本、分析语气、生成活动创意;
- 软件工程:代码自动补全、重构、文档编写、单元测试生成。
部署功能¶
| ID | 软件名称 | 兼容操作系统 | 虚拟机 | 物理机 | vGPU | GPU | 最低CPU(核) | 最低内存(GB) | 最低硬盘(GB) | 自定义域名 | 是否启用 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 410 | DeepSeek-r1:70b | Ubuntu 22.04 | - | - | + | + | 8 | 128 | 240 | 否 | 订购 |
- 安装时间为 30-40 分钟(含操作系统);
- Ollama 服务器在内存中加载并运行 LLM;
- Open WebUI 作为连接到 Ollama 服务器的 Web 应用程序部署;
- 用户通过 Open WebUI Web 界面与 LLM 交互,发送请求并接收响应;
- 所有计算和数据处理均在服务器本地进行。管理员可以通过 OpenWebUI 工具为特定任务配置 LLM。
系统要求和技术规格¶
- 操作系统:Ubuntu 22.04;
- 内存:至少 128 GB RAM;
- 图形加速器:2x5090,显存 32 GB(总计 64 GB)或其他配置。建议使用 A100/H100/RTX 6000 PRO
- 磁盘空间:足以安装系统、驱动程序和模型;
- 驱动程序:NVIDIA 驱动程序和 CUDA,以确保 GPU 正常运行;
- 显存消耗:在 2K token 上下文下为 48 GB;
- 自动重启:出现故障时设置自动容器重启;
- GPU 支持:与 NVIDIA CUDA 完全集成,以实现最大性能。
部署 DeepSeek-R1:70B 后的入门指南¶
付款后,将向注册时指定的地址发送电子邮件,通知您服务器已准备就绪。邮件中将包含 VPS IP 地址、访问服务器的登录名和密码,以及访问 OpenWebUI 控制面板的链接。我们公司的客户可以通过 服务器管理面板和 API — Invapi 管理设备。
-
访问服务器操作系统的登录数据(例如通过 SSH)将通过电子邮件发送给您。
-
访问带有 Open WebUI Web 界面的 Ollama 控制面板的链接:在 Invapi 控制面板的 Info >> Tags 选项卡下的 webpanel 标签中。服务器交付时,将通过电子邮件发送格式为
https://deepseek<Server_ID_from_Invapi>.hostkey.in的确切链接。
点击 webpanel 标签中的链接后,将打开 Get started with Open WebUI 登录窗口,您需要在此处创建聊天机器人的管理员账户名称、电子邮件和密码,然后按下 Create Admin Account 按钮:

注意
注册第一个用户后,系统会自动为其分配管理员角色。为了确保安全并控制注册过程,所有后续的注册请求都必须从管理员账户在 OpenWebUI 中批准。
备注
有关使用带有 Open WebUI 的 Ollama 控制面板功能的详细信息,请参阅文章 AI Chatbot on Your Own Server。
备注
为了获得最佳性能,建议使用显存超过最低要求 48 GB 的 GPU。这确保了处理更大上下文和并行请求的余量。有关 Ollama 和 Open WebUI 主要设置的详细信息,请参阅 Ollama 开发者文档 和 Open WebUI 开发者文档。