About 128,000,000 results
Open links in new tab
  1. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    DeepSeek-V3据我所知,是第一个(至少在开源社区内)成功使用FP8混合精度训练得到的大号MoE模型。 众所周知,FP8伴随着数值溢出的风险,而MoE的训练又非常不稳定,这导致实际大模型训练 …

  2. 普通人怎样用好Deepseek? - 知乎

    DeepSeek-R1则专门是为了 代码生成+数学问题解决 而设计,整体速度极快,精确度实测后非常高,推理能力一流。 适合需要快速实现技术需求的场景,比如程序员、理工科学生等。

  3. 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决? - 知乎

    随着DeepSeek的爆火,不少云服务商为了获取流量都提供了免费的DeepSeek-R1-满血版的API。 其中以硅基流动、腾讯云平台比较有代表性。

  4. 有必要自己将deepseek部署到本地吗? - 知乎

    所以我认为,deepseek部署有可行性就够了,至于有没有必要性,很多人没那么重要。 大家听到openai训练ai需要几千亿美元,让ai推理需要十块H100 (一块280万人民币),部署满血deepseekR1 …

  5. deepseek和chatgpt有什么区别?哪个更好用? - 知乎

    deepseek怎么样?DeepSeek是中式思维,Chatgpt则拥有典型的西方文化偏向; DeepSeek先进是低推理成本,Chatgpt先进是语言能力。 从研究两者的训练数据等方面,我们可以知道: DeepSeek更熟 …

  6. deepseek官网地址告诉我? - 知乎

    DeepSeek简介: DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9 …

  7. 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? - 知乎

    看到一个很好用的测试案例,可以用来简单测试是不是DeepSeek满血版。 请用我给你的四个数字,通过加、减、乘、除、括号,组成一个运算,使得结果为24。注意:数字需要全部我提供的数字:4 4 6 …

  8. DeepSeek深度思考和联网搜索有什么区别? - 知乎

    Feb 5, 2025 · DeepSeek为大家提供了:深度思考R1和联网搜索,两个功能强悍的按钮,但,在和知乎网友的交流过程中,我发现有很多人,不知道这两个强悍的工具如何搭配使用。今天就好好聊聊这个问 …

  9. 求问deepseek出现这种情况怎么办啊? - 知乎

    Jan 31, 2025 · DeepSeek 不是告诉你原因和解法了嘛。 原因:当前对话已超出深度思考的最大长度限制 解法:开启一个新对话继续思考吧 至于具体解释,得看这几个参数,DeepSeek R1 的 上下文长度 …

  10. 如何评价2025年8月19日DeepSeek新发布的V3.1模型?性能上有哪些优 …

    Aug 19, 2025 · DeepSeek-V3.1 此次 在工具调用和 Agent 的支持上有显著增强。 甚至已经支持直接将 DeepSeek-V3.1 接入 Claude Code。 给大家总结下此次版本带来了哪些能力的更新。 混合推理架 …