Ollama 使用笔记

一、安装 Ollama

从官网下载安装 Ollama。

查看版本号：

ollama --version

二、在 shell 中安装和运行模型

在 Models 中选择一个你想部署的模型，复制安装命令，并在终端中执行。

官方建议：应该至少有 8 GB 的 RAM 来运行 7b 版本，16 GB 的 RAM 来运行 13b 版本，32 GB 的 RAM 来运行 33b 版本。

本文以 deepseek-r1:7b 为例。

下载模型

ollama pull deepseek-r1:7b

Tip: 下载即将完成时速度可能会变得非常慢，只要按 Ctrl+C，再重新执行一次命令，就会继续正常下载。

显示模型信息

ollama show deepseek-r1:7b

运行模型（一次性响应）

ollama run deepseek-r1:7b "写一首诗"

运行模型（进入聊天模式）

ollama run deepseek-r1:7b

结束当前会话

/bye

列出所有模型

ollama list

列出当前加载的模型

ollama ps

停止当前正在运行的模型

ollama stop deepseek-r1:7b

删除一个模型

ollama rm deepseek-r1:7b

三、使用 REST API 调用模型

修改端口

ollama serve --port 11434

/api/generate 接口：生成一次性响应

curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-r1:7b",
  "prompt":"为什么天空是蓝色的？"
}'

/api/chat 接口：与模型聊天

curl http://localhost:11434/api/chat -d '{
  "model": "deepseek-r1:7b",
  "messages": [
    { "role": "user", "content": "你好呀！" }
  ]
}'

四、在 .NET 中调用

1、直接 HTTP 调用（基础方案）

创建 HttpClient，使用 PostAsJsonAsync 请求，使用 ReadFromJsonAsync 读取结果。

2、使用 OllamaSharp 库（推荐方案）

创建 OllamaApiClient，使用 SelectedModel 设置模型，使用 GenerateAsync 获得结果。或创建对话 ollama.Chat()，并 Send 内容。

3、.NET Aspire 集成（企业级方案）

适合微服务架构，结合容器化部署。

“OllamaSharp 库”和“.NET Aspire 集成”两种方案怎么选？

OllamaSharp 库：定位轻量级模型交互 SDK，适用于独立应用、微服务中的 AI 组件等场景，技术复度低，支持模型对话/生成/管理、流式响应、多模态支持，需自行实现监控、熔断。

.NET Aspire 集成：定位企业级云原生 AI 服务编排框架，适用于多服务协同的分布式系统，技术复度高，支持服务编排、健康检查、弹性伸缩、混合云部署，内置可观测性仪表盘、自动故障转移。

决策建议：初创项目用 OllamaSharp 快速试错，用户量破千后通过 Aspire 重构。两者并非互斥，可在 Aspire 中封装 OllamaSharp 客户端，兼顾灵活性与运维能力。

xoyozo 4 个月前

转载请注明出处