ollama 相关 | 大兵个人主页

ollama/ollama: Get up and running with Llama 3.1, Mistral, Gemma 2, and other large language models. (github.com)
Ollama
主要就是运行本地模型

使用 `HuggingFace` 模型

ollama内置模型数量太少，可以导入GGUF类型的模型。

创建一个文件，名称随意。比如config.txt

修改第一行为本地的模型文件位置

FROM "C:\Users\db117\.cache\lm-studio\models\second-state\gte-Qwen2-1.5B-instruct-GGUF\gte-Qwen2-1.5B-instruct-Q5_K_M.gguf"

TEMPLATE """{{- if .System }}
<|im_start|>system {{ .System }}<|im_end|>
{{- end }}
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""

SYSTEM """"""

PARAMETER stop <|im_start|>
PARAMETER stop <|im_end|>

执行命令即可

ollama create llama3-cn -f ./config.txt

安装可视化Web

https://openwebui.com/
open-webui/open-webui: User-friendly WebUI for LLMs (Formerly Ollama WebUI) (github.com)

使用docker安装

需要修改本地隐射端口
修改ollama，IP端口
WEBUI_AUTH 表示不需要登录
修改-v参数为本地的数据文件夹

docker run -d -p 4000:8080 -e OLLAMA_BASE_URL=http:/ip:port -e WEBUI_AUTH=False -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main

使用 HuggingFace 模型 ​

安装可视化Web ​

使用 `HuggingFace` 模型

安装可视化Web