本地部署
简介
DeepSeek 中文名「深度求索」,是一家专注实现通用人工智能(以大模型为代表)的科技公司。它由量化资管巨头「幻方量化」创立于 2023 年 7 月。
DeepSeek 已经发布 13 个大模型,并且都已开源。全球开发者都能使用 DeepSeek 的技术开发自己的模型、应用、产品。
一,lmstudio搜索模型报错
我们经常会看到大模型后面,会跟一个奇怪的后缀,如:
lmstudio搜索模型报错,设置Hugging Face代理
Tips
在大模型里面,有一个极其重要的概念,叫:参数量。
b是英文billion的简写,意思是十亿。7b就是70亿,8b就是80亿,是指大模型的神经元参数(权重参数weight+bias)的总量。
