Qwen3-Coder¶
在这篇文章中
信息
Qwen3-Coder 是 Qwen 系列中用于编程的最先进模型。该模型提供 30B 版本,通过 Ollama 平台进行本地部署需要大量的计算资源。部署基于 Ubuntu 22.04,内核更新至版本 6,配备 NVIDIA 驱动、CUDA,并集成 Open Web UI 以提供便捷的 Web 界面。
Qwen3-Coder 的主要功能¶
- 高效的 30B 模型:qwen3-coder:30b 模型拥有 30B 总参数,但仅激活 3.3B,在保持高效的同时提供高性能;
- 卓越的 Agent 能力:通过 SWE-Bench 等基准测试在长期任务上进行高级强化学习,针对实际软件开发任务进行了优化;
- 长上下文支持:原生支持 256K 令牌,并使用比例优化外推方法可扩展至 1M 令牌,专为理解仓库规模而优化;
- 扩展预训练:在 7.5 万亿令牌上进行训练,代码占比 70%,同时保持强大的通用和数学能力;
- 基于执行的學習:基于代码执行的强化学习显著提高了在各种实际编程任务中执行代码的成功率;
- 与 Open Web UI 集成:通过 8080 端口提供现代 Web 界面,便于与模型交互,确保对数据和请求处理的完全控制;
- 安全与控制:完全本地部署确保代码和数据保密,而 OLLAMA_HOST 和 OLLAMA_ORIGINS 设置保证网络安全;
- 容错能力:集成系统自动重启容器和服务,确保持续稳定运行。
- 使用示例:
- 软件开发:自动化代码编写、重构和调试;
- Agent 任务:使用工具执行复杂的多步骤编程任务;
- 浏览器工作:自动化 Web 开发和测试;
- 仓库分析:理解和处理大型代码库;
- 代码审查:自动分析和改进代码质量;
- 代码文档:生成技术文档和注释。
部署功能¶
| ID | 软件名称 | 兼容操作系统 | 虚拟机 | 物理机 | vGPU | GPU | 最低CPU(核) | 最低内存(GB) | 最低硬盘(GB) | 自定义域名 | 是否启用 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 340 | qwen3-coder:30b | Ubuntu 22.04 | - | - | + | + | 8 | 60 | - | 否 | 订购 |
构建的技术特性:
- Ubuntu 22.04,内核更新至版本 6;
- 最新 NVIDIA 驱动程序;
- CUDA Toolkit;
- 用于模型管理的 Ollama;
- 用于 Web 界面的 OpenWebUI。
安装特性:
- 安装时间为 25-45 分钟,包括操作系统安装;
- Ollama 服务器在 GPU/RAM 内存中加载并运行 Qwen3-Coder 模型;
- Open WebUI 作为连接到 Ollama 服务器的 Web 应用程序部署;
- 用户通过 Open WebUI Web 界面与模型交互,进行编程和 Agent 任务;
- 所有计算和代码处理均在服务器本地进行;
- 管理员可以通过 OpenWebUI 工具为特定开发任务配置模型;
- 支持各种级别的量化以优化内存使用。
部署 Qwen3-Coder 后的入门指南¶
付款后,将向注册时指定的电子邮件发送服务器准备就绪的通知。该通知将包含 VPS IP 地址、连接服务器的登录名和密码,以及访问 OpenWebUI 面板的链接。我们公司的客户在 服务器管理和 API 面板 — Invapi 中管理设备。
-
访问服务器操作系统的身份验证数据(例如,通过 SSH)将通过电子邮件发送给您。
-
访问带有 Open WebUI Web 界面的 Ollama 管理面板的链接:在 Invapi 控制面板的 Configuration >> Tags 选项卡中的 webpanel 标签中。部署服务器时发送的邮件中将包含确切链接,格式为
https://qwen3-coder<Server_ID_from_Invapi>.hostkey.in。
点击 webpanel 标签中的链接后,将打开 Get started with Open WebUI 登录窗口,您需要在此处创建聊天机器人的管理员账户名称、电子邮件和密码,然后按下 Create Admin Account 按钮:

警告
注册第一个用户后,系统会自动为其分配管理员角色。为了确保安全并控制注册过程,所有后续的注册请求都必须从管理员账户在 OpenWebUI 中批准。
注册成功后,将打开带有 Qwen3-Coder 访问权限的 Open WebUI 主界面:

备注
有关使用带有 Open WebUI 的 Ollama 管理面板功能的详细描述,请参阅文章 您自己服务器上的 AI 聊天机器人
备注
为了与 Qwen3-Coder 模型配合实现最佳运行效果,建议使用至少 20 GB 显存的 GPU 用于 30B 模型。这确保了长代码上下文和复杂 Agent 任务的高效处理。有关 Ollama 基本设置和 Open WebUI 的详细信息,请参阅 Ollama 开发者文档 和 Open WebUI 开发者文档。
使用建议
为了最大限度地发挥 Qwen3-Coder 的效率,建议:
- 使用长上下文来分析大型代码库
- 在编程时指定明确的技术要求
- 利用 Agent 能力处理多步骤开发任务
- 通过 API 将模型与现有开发工具集成