Skip to content

Phi-4-14b

在这篇文章中

信息

Phi4-14b 是一个通过 Ollama 平台适配用于本地部署的现代语言模型。该解决方案结合了 Phi-4 模型的性能与使用 Open Web UI 的便利性。系统部署在 Ubuntu 22.04 上,需要现代图形加速器才能高效运行。Ollama 和 Open Web UI 的组合创建了一个功能完善的本地人工智能解决方案,提供对数据和请求处理过程的完全控制。

Phi-4-14b 的主要功能

  • 强大的基础架构:该模型拥有 140 亿参数和 16,000 个 token 的上下文窗口,能够以高精度处理长文本和复杂任务;

  • 便捷的 Open Web UI 界面:提供用于与模型交互的现代 Web 界面,包括聊天历史记录、参数设置以及在单一界面中管理不同模型;

  • 高级 RAG 功能:内置支持搜索各种格式(PDF、PPT、文本文件)的文档以及网页抓取,使模型能够处理最新信息和用户数据;

  • 多任务处理能力:该模型能高效处理各种任务,包括对话管理、回答问题、数据分析、文本创作和基础编程;

  • 安全性与准确性:该模型在专家监督下经过考虑用户偏好的多阶段训练,确保响应的高准确性、遵守伦理规范并遵循用户指令;

  • 开放性与灵活性:得益于 Ollama 的开源代码,系统可根据特定需求进行配置和修改,包括与其他工具和服务的集成;

  • 支持多种数据类型:该模型能够处理文本数据、代码、结构化和半结构化数据,扩大了其在各个领域的应用范围。

  • 使用示例

    • 客户支持:自动化响应用户问题;

    • 教育:创建教育材料,协助解决任务;

    • 营销:生成广告文案,分析评论;

    • 软件开发:创建和编写代码文档。

部署功能

ID 软件名称 兼容操作系统 虚拟机 物理机 vGPU GPU 最低CPU(核) 最低内存(GB) 最低硬盘(GB) 自定义域名 是否启用
256 Phi-4-14b Ubuntu 22.04 - - + + 4 16 - 订购
  • 安装时间为 15-30 分钟(含操作系统);

  • Ollama 服务器加载并在内存中运行大语言模型 (LLM);

  • Open WebUI 作为连接到 Ollama 服务器的 Web 应用程序部署;

  • 用户通过 Open WebUI 的 Web 界面与 LLM 交互,发送请求并接收响应;

  • 所有计算和数据处理均在服务器本地进行。管理员可以使用 OpenWebUI 工具为特定任务配置 LLM。

系统要求与技术特性

  • 图形加速器:NVIDIA A4000(或更高性能)或具有至少 16 GB 显存的 AMD 等效显卡;

  • 磁盘空间:足以安装系统、驱动程序和模型;

  • 驱动程序:NVIDIA 驱动程序和 CUDA,以确保 GPU 正常运行;

  • 显存占用:在 2K token 上下文下为 12 GB;

  • 自动重启:配置了故障情况下的自动容器重启;

  • GPU 支持:与 NVIDIA CUDA 完全集成以实现最大性能。

部署 Phi-4-14b 后的入门指南

付款后,将向注册时指定的电子邮件发送订单通知,表明服务器已准备好使用。通知中将包含 VPS IP 地址、连接服务器的登录名和密码,以及访问 OpenWebUI 面板的链接。我们公司的客户可以在 服务器管理和 API 控制面板Invapi 中管理设备。

  • 访问服务器操作系统的登录数据(例如通过 SSH)将通过收到的电子邮件发送给您。

  • 访问带有 Open WebUI Web 界面的 Ollama 管理面板的链接:位于 Invapi 控制面板的 Configuration >> Tags 选项卡中的 webpanel 标签内。服务器交付时,将通过电子邮件发送格式为 https://phi<Server_ID_from_Invapi>.hostkey.in 的确切链接。

点击 webpanel 标签中的链接后,将打开 Get started with Open WebUI 登录窗口,您需要在此处为您的聊天机器人创建管理员账户名称、电子邮件和密码,然后按下 Create Admin Account 按钮:

警告

注册第一个用户后,系统会自动为其分配管理员角色。为了确保安全并控制注册过程,所有后续的注册请求都必须从管理员账户在 OpenWebUI 中批准。

备注

有关使用带有 Open WebUI 的 Ollama 管理面板功能的详细描述,请参阅文章 AI Chatbot on Your Own Server

备注

建议使用的 GPU 显存超过最低要求的 16 GB,以实现最佳运行效果,为处理大上下文和并行请求提供余量。有关 Ollama 主要设置和 Open WebUI 的详细信息,请参阅 Ollama 开发者文档Open WebUI 开发者文档

使用 API 订购带有 Phi-4-14b 的服务器

question_mark
Is there anything I can help you with?
question_mark
AI Assistant ×