Skip to content

Qwen3-32B

在这篇文章中

信息

Qwen3-32B 是 Qwen 系列中一款先进的下一代语言模型,通过 Ollama 平台进行本地部署需要大量的计算资源。部署基于使用 NVIDIA 图形加速器的现代系统。与 Open Web UI 的集成提供了与模型交互的便捷界面,同时保持对数据的完全控制。

Qwen3-32B 的主要功能

  • 多语言架构:该模型拥有 320 亿个参数,支持 119 种语言和方言,在 36 万亿词的训练数据上训练,确保了对文化细微差别的理解以及高质量的翻译;
  • 运行模式:针对深度推理(思考模式)和快速响应(非思考模式)进行了优化,能够适应各种任务类型;
  • 与 Open Web UI 集成:通过 8080 端口提供现代化的 Web 界面,以便与模型进行便捷交互,确保对数据和请求处理的完全控制;
  • 可扩展性:支持不同级别的量化(FP16、8 位、4 位),可根据可用资源优化内存使用;
  • 安全性与控制:完全本地部署确保数据保密性,而 OLLAMA_HOST 和 OLLAMA_ORIGINS 设置则保证网络安全;
  • 高性能:在高性能消费级 GPU 上可实现每秒约 34 个 token,使该模型适用于本地使用;
  • 容错能力:内置的自动容器和服务重启系统确保稳定运行。
  • 使用示例
    • 客户支持:自动化响应用户问题,支持多种语言;
    • 教育:创建教育材料,协助解决复杂任务;
    • 编程:代码生成与分析,支持多种编程语言;
    • 多语言内容:考虑文化特性的文本创建与翻译。

部署功能

ID 软件名称 兼容操作系统 虚拟机 物理机 vGPU GPU 最低CPU(核) 最低内存(GB) 最低硬盘(GB) 自定义域名 是否启用
334 qwen3:32b Ubuntu 22.04 - - + + 4 64 - 订购
  • 安装时间为 20-40 分钟(含操作系统);
  • Ollama 服务器加载并在 GPU/RAM 内存中运行 Qwen3-32B 模型;
  • Open WebUI 作为连接到 Ollama 服务器的 Web 应用程序部署;
  • 用户通过 Open WebUI Web 界面与模型交互,发送请求并接收响应;
  • 所有计算和数据处理均在服务器上本地进行,支持多语言;
  • 管理员可以通过 OpenWebUI 工具为特定任务配置模型。

部署 Qwen3-32B 后的入门指南

订单付款后,系统将向注册时指定的电子邮件发送服务器准备就绪的通知。通知中将包含 VPS IP 地址、连接服务器的登录名和密码,以及访问 OpenWebUI 面板的链接。我司客户可通过 服务器管理面板和 APIInvapi 管理设备。

  • 访问服务器操作系统的身份验证数据(例如通过 SSH)将通过收到的电子邮件发送给您。
  • 访问带有 Open WebUI Web 界面的 Ollama 管理面板的链接:位于 Invapi 控制面板的 Configuration >> Tags 选项卡中的 webpanel 标签内。服务器交付时,电子邮件中会发送确切链接,格式为 https://qwen3-32b<Server_ID_from_Invapi>.hostkey.in

点击 webpanel 标签中的链接后,将打开 Get started with Open WebUI 登录窗口,您需要在此处创建聊天机器人的管理员账户名称、电子邮件和密码,然后按下 Create Admin Account 按钮:

警告

注册第一个用户后,系统会自动为其分配管理员角色。为确保安全性和对注册过程的控制,所有后续的注册请求都必须从管理员账户在 OpenWebUI 中批准。

注册成功后,将打开 Open WebUI 的主界面:

备注

有关使用带有 Open WebUI 的 Ollama 管理面板功能的详细描述,请参阅文章 AI Chatbot on Your Own Server

备注

为了最佳运行效果,建议使用显存大于最低要求 16 GB 的 GPU,这将为处理大型上下文和并行请求提供缓冲。有关 Ollama 和 Open WebUI 主要设置的详细信息,请参阅 Ollama 开发者文档Open WebUI 开发者文档

使用 API 订购带有 Qwen3-32B 的服务器

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×