DeepSeek
是幻方量化旗下的一家大模型企业,成立于2023年7月份,致力于探索人工智能本质。

主要产品线
最新版本包含两个主要产品线:
- DeepSeek V3:基础模型系列,提供通用 AI 能力。
- DeepSeek R1:专注于推理和编程能力。
DeepSeek
相关模型已经开源,以下是不同模型的开源地址:
DeepSeek Coder
:代码大模型,仓库地址:https://github.com/DeepSeek-AI/DeepSeek-Coder
DeepSeek LLM
:通用大语言模型,仓库地址:https://github.com/DeepSeek-AI/DeepSeek-LLM
DeepSeek-R1
,仓库地址:https://github.com/deepseek-ai/DeepSeek-R1
DeepSeek-R1
与V3的关系:
DeepSeek-R1
是基于DeepSeek-V3
的进一步优化,通过强化学习和蒸馏技术提升其推理能力。

DeepSeek
满血版与蒸馏版:
版本 | 参数规模 | 性能表现 | 适用场景 | 部署成本 | 响应速度 |
---|---|---|---|---|---|
满血版 | 6710亿参数 | 复杂推理能力强,支持详细思考过程 | 科研、高级数据分析、自然语言生成 | 高 | 较慢 |
蒸馏版 | 1.5B~32B | 推理能力适中,无详细思考过程 | 小型企业、实时交互场景 | 中 | 快 |
量化版 | 压缩后的小模型 | 推理速度快,精度略有下降 | 移动端、边缘设备 | 低 | 很快 |
基本使用
网页版:
服务状态监控:
一般来说,当服务状态为红色时,会较频繁的出现:服务器繁忙,请稍后再试的提示。
官方提示词库:
官方提供了13个
DeepSeek
提示词样例,可以作为参考:
联网搜索:
目前
DeepSeek
的预训练数据更新到2024年7月。联网搜索使
DeepSeek
不仅能依赖它自己的知识库,还能根据互联网实时搜索相关内容来回答问题。联网搜索模式基于
RAG
(检索增强生成)。
学习资料
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
清华大学《DeepSeek:从入门到精通》:
https://url81.ctfile.com/f/57345181-1460410030-b87ec0?p=3899
访问密码:3899
清华大学:DeepSeek与AI幻觉:
https://url81.ctfile.com/f/57345181-1494284845-5f75e2?p=3899
访问密码:3899
清华大学:DeepSeek+DeepResearch:让科研像聊天一样简单:
https://url81.ctfile.com/f/57345181-1494285146-a0ce6b?p=3899
访问密码:3899
清华大学:普通人如何抓住DeepSeek红利:
https://url81.ctfile.com/f/57345181-1494285374-29756d?p=3899
访问密码:3899
清华大学:DeepSeek赋能职场:
https://url81.ctfile.com/f/57345181-1494285536-bd574f?p=3899
访问密码:3899
DeepSeek_R1:
https://url81.ctfile.com/f/57345181-1494285706-9e4e95?p=3899
访问密码:3899
基础技巧
提问加上背景描述:
需要向
DeepSeek R1
说清楚:
- 我是谁(如我一个互联网打工人)。
- 我当前的水平(如我是自媒体小白)。
- 我想让
DeepSeek
充当的角色(如你是一名自媒体运营专家)等。有时
DeepSeek
回答的内容可能不是你想要的,这时可以增加约束条件,来限制、优化它回答的内容。即:背景+需求+约束条件。
如:我家小孩读初一(交待背景),怎样提高他的英语水平(提出需求),不需要考虑口语问题 (约束条件)。
学会说人话:
问到一些专业领域的问题时,
DeepSeek
的回答会掺杂很多专业名词来解释问题。只需要在提示词中加上说人话、大白话、通俗易懂等。
告别提示词:
DeepSeek
可以完全不用准备提示词,只要简单明了地描述你的需求,DeepSeek
就能理解并给出精准的答案。与
DeepSeek
的对话,尽量使用简单、直白的语言,越是接地气的表达,DeepSeek
就越能发挥其最大潜力。
DeepSeek
的理解能力非常强,不需要过多的引导,给它一个清晰的问题,它就能提供精准的答复。
小学生沟通方式:
与
DeepSeek
对话时,有时可能觉得AI的回答过于抽象。
- 源于传统AI模型过于注重结构化表达。
DeepSeek
可以给它一个提示:比如:我是一名小学生,请用小学生能听懂的话解释什么是大模型。
活用上传附件:
DeepSeek
的推理模型,不仅能联网,还支持上传附件。
- 推理+上传附件,可以做更多本地化、私密化的东西。
- 比如你自己的知识库或者内部资料,让其基于自有知识库进行推理和思考。
可以通过开启 联网搜索 实时搜索内容,上传附件来精准分析。
对于不能搜索的地址,先手动下载资料后,再上传给
DeepSeek R1
帮助分析。
对标模仿能力:
可以让
DeepSeek
模仿名人风格,因为它对中文的掌握能力极强,能模仿名人的写作风格。
结合V3和R1:
先跟V3多轮对话,得到要推理的细节和提示词,然后发给R1,让R1再来推理、输出。
这样,就能将
DeepSeek
的能力又提升一个等级。
持续追问:
运用持续追问的技巧,能够帮你快速搞清楚一个复杂问题,大致步骤如下:
- 提出一个概括性的问题。
- 基于回答内容进行深入追问。
- 继续挖掘具体细节。
- 让
DeepSeek
把对话整理成详细的清单格式。