林夕笔记林夕笔记
首页
关于我
首页
关于我
  • 人工智能

    • 深度求索 [DeepSeek]

      • 基础了解
      • 本地部署
        • 一,lmstudio搜索模型报错
      • 模型微调
    • JavaScript高级

本地部署

简介

DeepSeek 中文名「深度求索」,是一家专注实现通用人工智能(以大模型为代表)的科技公司。它由量化资管巨头「幻方量化」创立于 2023 年 7 月。
DeepSeek 已经发布 13 个大模型,并且都已开源。全球开发者都能使用 DeepSeek 的技术开发自己的模型、应用、产品。

一,lmstudio搜索模型报错

我们经常会看到大模型后面,会跟一个奇怪的后缀,如:

lmstudio搜索模型报错,设置Hugging Face代理

Tips

在大模型里面,有一个极其重要的概念,叫:参数量。
b是英文billion的简写,意思是十亿。7b就是70亿,8b就是80亿,是指大模型的神经元参数(权重参数weight+bias)的总量。

Prev
基础了解
Next
模型微调