Phi-4-14b¶
在这篇文章中
信息
Phi4-14b 是一个通过 Ollama 平台适配用于本地部署的现代语言模型。该解决方案结合了 Phi-4 模型的性能与使用 Open Web UI 的便利性。系统部署在 Ubuntu 22.04 上,需要现代图形加速器才能高效运行。Ollama 和 Open Web UI 的组合创建了一个功能完善的本地人工智能解决方案,提供对数据和请求处理过程的完全控制。
Phi-4-14b 的主要功能¶
-
强大的基础架构:该模型拥有 140 亿参数和 16,000 个 token 的上下文窗口,能够以高精度处理长文本和复杂任务;
-
便捷的 Open Web UI 界面:提供用于与模型交互的现代 Web 界面,包括聊天历史记录、参数设置以及在单一界面中管理不同模型;
-
高级 RAG 功能:内置支持搜索各种格式(PDF、PPT、文本文件)的文档以及网页抓取,使模型能够处理最新信息和用户数据;
-
多任务处理能力:该模型能高效处理各种任务,包括对话管理、回答问题、数据分析、文本创作和基础编程;
-
安全性与准确性:该模型在专家监督下经过考虑用户偏好的多阶段训练,确保响应的高准确性、遵守伦理规范并遵循用户指令;
-
开放性与灵活性:得益于 Ollama 的开源代码,系统可根据特定需求进行配置和修改,包括与其他工具和服务的集成;
-
支持多种数据类型:该模型能够处理文本数据、代码、结构化和半结构化数据,扩大了其在各个领域的应用范围。
-
使用示例:
-
客户支持:自动化响应用户问题;
-
教育:创建教育材料,协助解决任务;
-
营销:生成广告文案,分析评论;
-
软件开发:创建和编写代码文档。
-
部署功能¶
| ID | 软件名称 | 兼容操作系统 | 虚拟机 | 物理机 | vGPU | GPU | 最低CPU(核) | 最低内存(GB) | 最低硬盘(GB) | 自定义域名 | 是否启用 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 256 | Phi-4-14b | Ubuntu 22.04 | - | - | + | + | 4 | 16 | - | 否 | 订购 |
-
安装时间为 15-30 分钟(含操作系统);
-
Ollama 服务器加载并在内存中运行大语言模型 (LLM);
-
Open WebUI 作为连接到 Ollama 服务器的 Web 应用程序部署;
-
用户通过 Open WebUI 的 Web 界面与 LLM 交互,发送请求并接收响应;
-
所有计算和数据处理均在服务器本地进行。管理员可以使用 OpenWebUI 工具为特定任务配置 LLM。
系统要求与技术特性¶
-
图形加速器:NVIDIA A4000(或更高性能)或具有至少 16 GB 显存的 AMD 等效显卡;
-
磁盘空间:足以安装系统、驱动程序和模型;
-
驱动程序:NVIDIA 驱动程序和 CUDA,以确保 GPU 正常运行;
-
显存占用:在 2K token 上下文下为 12 GB;
-
自动重启:配置了故障情况下的自动容器重启;
-
GPU 支持:与 NVIDIA CUDA 完全集成以实现最大性能。
部署 Phi-4-14b 后的入门指南¶
付款后,将向注册时指定的电子邮件发送订单通知,表明服务器已准备好使用。通知中将包含 VPS IP 地址、连接服务器的登录名和密码,以及访问 OpenWebUI 面板的链接。我们公司的客户可以在 服务器管理和 API 控制面板 — Invapi 中管理设备。
-
访问服务器操作系统的登录数据(例如通过 SSH)将通过收到的电子邮件发送给您。
-
访问带有 Open WebUI Web 界面的 Ollama 管理面板的链接:位于 Invapi 控制面板的 Configuration >> Tags 选项卡中的 webpanel 标签内。服务器交付时,将通过电子邮件发送格式为
https://phi<Server_ID_from_Invapi>.hostkey.in的确切链接。
点击 webpanel 标签中的链接后,将打开 Get started with Open WebUI 登录窗口,您需要在此处为您的聊天机器人创建管理员账户名称、电子邮件和密码,然后按下 Create Admin Account 按钮:

警告
注册第一个用户后,系统会自动为其分配管理员角色。为了确保安全并控制注册过程,所有后续的注册请求都必须从管理员账户在 OpenWebUI 中批准。
备注
有关使用带有 Open WebUI 的 Ollama 管理面板功能的详细描述,请参阅文章 AI Chatbot on Your Own Server
备注
建议使用的 GPU 显存超过最低要求的 16 GB,以实现最佳运行效果,为处理大上下文和并行请求提供余量。有关 Ollama 主要设置和 Open WebUI 的详细信息,请参阅 Ollama 开发者文档 和 Open WebUI 开发者文档。