ollama_zh

使用Ollama进行聊天

Ollama 是一个多平台（macOS, Windows, Linux）的大模型聊天程序，能够加载GGUF格式（llama.cpp）的模型。接下来将简要介绍使用方法。其余用途请自行尝试和查阅官方手册进行了解。

Step 1: 下载对应平台的应用程序

进入官方页面下载对应平台的软件：https://ollama.com/download

⚠️ 请务必使用v0.1.33以上版本，否则会出现无限生成的问题。

Step 2: 安装Ollama

macOS：下载完毕之后直接拖入“应用程序”
Windows preview：下载运行exe文件
Linux：执行以下命令

curl -fsSL https://ollama.com/install.sh | sh

其余平台请参考：https://github.com/ollama/ollama?tab=readme-ov-file#ollama

Step 3：创建`Modelfile`文件

在文本编辑器中编写Modelfile文件，其内容如下：

FROM /your-path-to-ggml/ggml-model-q8_0.gguf
TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ .Response }}<|eot_id|>"""
SYSTEM """You are a helpful assistant. 你是一个乐于助人的助手。"""
PARAMETER temperature 0.2
PARAMETER num_keep 24
PARAMETER stop <|start_header_id|>
PARAMETER stop <|end_header_id|>
PARAMETER stop <|eot_id|>

其中：

FROM字段指向GGUF文件的路径，由于是聊天交互，这里使用的是Instruct模型
TEMPLATE字段定义了Llama-3-Instruct的指令模板格式
SYSTEM字段定义了系统指令（目前设置为空）
PARAMETER字段定义了一些超参数，详细列表参见：https://github.com/ollama/ollama/blob/main/docs/modelfile.md

Step 4：创建模型实例

命令行中运行以下命令，创建一个名为llama3-zh-inst（名字可自定义）的模型实例，加载Modelfile配置：

ollama create llama3-zh-inst -f Modelfile

创建过程输出日志如；

transferring model data
creating model layer
creating template layer
creating system layer
creating parameters layer
creating config layer
using already created layer sha256:f2a44c6358e8e0a60337f8a1b31f55f457558eeefd4f344272e44b0e73a86a32
using already created layer sha256:8ab4849b038cf0abc5b1c9b8ee1443dca6b93a045c2272180d985126eb40bf6f
writing layer sha256:b821abf159071cfc90f0941b5ca7ef721f229cfcfadcf95b5c58d0ceb3e773c7
writing layer sha256:dc4ec177268acc3382fc6c3a395e577bf13e9e0340dd313a75f62df95c48bc1d
writing manifest
success

输出success后，即表示完成创建。

Step 5：开始聊天

输入以下命令进入聊天程序

ollama run llama3-zh-inst

在>>>后输入用户指令；输入/bye结束聊天。

关于ollama的其他用法，请参考官方文档：https://github.com/ollama/ollama?tab=readme-ov-file#cli-reference

中文文档

English Docs

Model Reconstruction
Model Quantization, Inference and Deployment
System Performance
Training Scripts
- Pre-training Scripts
- Instruction Fine-tuning Scripts
FAQ

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ollama_zh

使用Ollama进行聊天

Step 1: 下载对应平台的应用程序

Step 2: 安装Ollama

Step 3：创建`Modelfile`文件

Step 4：创建模型实例

Step 5：开始聊天

中文文档

English Docs

Clone this wiki locally

ollama_zh

使用Ollama进行聊天

Step 1: 下载对应平台的应用程序

Step 2: 安装Ollama

Step 3：创建Modelfile文件

Step 4：创建模型实例

Step 5：开始聊天

中文文档

English Docs

Clone this wiki locally

Step 3：创建`Modelfile`文件