跳转至

本地部署 DeepSeek-R1 模型


2025-03-01 by dongnan

开始之前

最近被 DeepSeek-R1 刷屏,作为IT从业者咱也不能落伍,立刻在手机上下载 DeepSeek 开始体验,提出的问题回答的和 ChatGPT 不相上下,让人惊叹!

不过由于 DeepSeek 太火爆,APP连接后端服务器总时超时,既然是开源的 LLM (Large Language Model) 那么是不是可以尝试本地部署 DeepSeek-R1 模型。

环境描述

  • Ollama: v0.5.11
  • deepseek-r1:14b
  • Chatbox: v1.9.7

测试平台

CPU: i7-11700K
内存: 32.0 GB
显卡: NVIDIA GeForce RTX 3070
磁盘: 1TB SSD
系统: Windows 11

一些名词

什么是 LLM ?

大型语言模型, Large Language Model 的英文缩写。

例如,ChatGPT、LLaMA、Qwen、DeepSeek、Gemma 等它们都是 LLM。

LLM 的参数代表什么?

例如 deepseek-r1:14b 数字后面的 "B" 代表的是参数(Parameters) 的数量级,B = Billion(十亿)。

  • 14B = 14 Billion = 140 亿 参数
  • 670B = 670 Billion = 6700 亿 参数

参数(Parameters)是神经网络中的权重(Weights)和偏置(Bias),它们决定了模型的学习能力和表达能力。参数越多,模型通常越强大,可以学习更复杂的模式,但也需要更多的计算资源进行训练和推理。

为什么GPU更重要?

这是因为 GPU 在并行计算和矩阵运算方面的强大性能,它能极大加速 深度学习训练和推理

什么是Ollama?

Ollama 是一个开源工具,旨在简化大型语言模型的本地部署和操作。它由活跃的社区维护并定期更新,提供了一个轻量且易于扩展的框架,使开发人员能够轻松地在本地机器上构建和管理LLMs。这消除了复杂的配置或依赖外部服务器的需要,使其成为各种应用的理想选择。

什么是 Chatbox AI?

Chatbox AI 是一款人工智能客户端应用和智能助手。兼容多种前沿的人工智能模型和 API。支持 Windows、MacOS、Android、iOS、Web 和 Linux 平台。

可以简单理解为 LLM 的 UI客户端工具。

什么是 AnythingLLM?

AnythingLLM 是一个开源的企业级文档聊天机器人解决方案,由 Mintplex Labs Inc. 开发。它支持多种文档格式(如 PDF、TXT、DOCX 等),并能将文档内容转化为大语言模型(LLM)可理解的上下文信息,从而实现智能对话。

操作步骤

安装 Ollama 框架

首先,访问 Ollama网站 并下载安装包,双击安装包,全程点击 “下一步”,直到安装结束。

安装完成后,按Win+R输入cmd打开命令行,输入以下命令验证:

$ ollama -v
ollama version is 0.5.11

部署 DeepSeek-R1 模型

首先,根据硬件实际情况选择不同参数版本,我这里选择的是 14B ,其它参数可以参考这里

安装模型

$ ollama run deepseek-r1:14b

注意:14b 参数的版本,文件为9GB,需要耐心等待下载完成。

运行模型

$ ollama run deepseek-r1:14b

默认命令行交互

>>> 你是谁?
<think>

</think>

您好!我是由中国的深度求索(DeepSeek)公司开发的智能助手DeepSeek-R1。如您有任何任何问题,我会尽我所能为您提供帮助。

>>> /bye

可视化UI

命令行方式与 deepseek 交互,对大部分人来说都是个麻烦事情,有多种软件提供UI界面代替命令行,方便操作,例如: Chatbox

首先,安装该软件

  • 访问 Chatbox网站 并下载安装包,双击安装包,全程点击 “下一步”,直到安装结束。

然后,配置模型

  • 打开 Chatbox -> 设置 -> 模型
  • 模型提供方 -> 选择 OLLAMAAPI 将自动填写 API地址
  • 模型选择 deepseek-r1:14b
  • 点击保存。

开始对话

注意:GPU性能

扩展

ollama 命令帮助信息

ollama

Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama
  create      Create a model from a Modelfile
  show        Show information for a model
  run         Run a model
  stop        Stop a running model
  pull        Pull a model from a registry
  push        Push a model to a registry
  list        List models
  ps          List running models
  cp          Copy a model
  rm          Remove a model
  help        Help about any command

接下来会记录 deepseek 在实际中环境有哪些场景,例如金融、编程等场景。

参考

回到页面顶部