DeepSeek获得了空前的成功，那他有没有什么不足之处？

心中u你 · 发表于 2025-1-31 15:12

登陆有奖并可浏览互动！

您需要登录才可以下载或查看，没有账号？立即注册

×

DeepSeek获得了空前的成功，那他有没有什么不足之处？
原文地址：https://www.zhihu.com/question/10714927807

大力水手 · 发表于 2025-1-31 15:12

不足之处：官方APP没有语音对话功能。
不过我做了一个把DeepSeek接入Siri的免费保姆级教程，这样就可以快速和DeepSeek语音对话了。苹果设备用户（iPhone、iPad、Mac等等）都可用。安卓、鸿蒙用户等后续我更新此文。DeepSeek接入苹果Siri教程如下：
一、进入DeepSeek官网，点击右上角的API开放平台获取免费API

官网如下：
DeepSeek注意先注册账号之后，再进入API开放平台获取官方免费送的API。如果API开放平台显示维护中，则等待官方维护完成后再进入。如果急用API，评论区留言。

然后点击创建API key，随便命名（比如Siri），然后复制你创建的API（这里格外注意，API只能复制一次，确定复制之后再关掉显示API的窗口）

二、苹果设备用户导入DeepSeek语音助手快捷指令

1、在Safari浏览器里打开下面的DeepSeek语音助手快捷指令链接：
https://www.icloud.com/shortcuts/d9ab1673e6b14c0ab0c4d208b619133c
（注意：快捷指令这个APP是苹果设备自带的，如果你删除了就去App Store先下载）

2、然后依次点击【获取捷径】、【设置快捷指令】，在弹出的文本框里输入第一步里你复制的API之后（API是sk开头的一长串数字字母），再点击【添加快捷指令】，然后快捷指令的第一个就是【DeepSeek语音助手】了。

3、最后点击这个快捷指令之后，再点击后续弹窗的【允许】、【始终允许】，允许语音对话之后，就可以使用了！
另外如果你是iPhone15Pro及之后的带有自定义操作按钮的机型，你还可以通过：设置-操作按钮-快捷指令-选取快捷指令-DeepSeek语音助手。这样就设置好了iPhone左上角的操作按钮（原来的静音按键）来一键打开DeepSeek语音助手对话！
本文会持续不断更新其他基于DeepSeek的API的好用的快捷指令和教程，建议点赞+收藏喔！

清风寡欲 · 发表于 2025-1-31 15:12

如果你真正重度在生产环境和日常使用过，你会发现，最好用的还是Claude Sonnet（有一次我称呼Claude 为Sonnet被她非常强硬（出乎意料的口气）地纠正了，自那之后我都叫她Claude）。
代码方面DS-R1的思维链非常适合你跟着学，搞清楚自己哪里可能错了，但是它的成品代码是依托答辩，完全追不上Claude。因此我最常使用R1的场景是出bug时把整个codebase扔过去，跟着他的思维链找究竟是什么文件出错了，然后思考一下可能解法，再和Claude对话。R1写设计文档是可以的，思维链很缜密。此外，Claude的知识广度似乎更大。
日常对话上，Claude的共情能力还是独一档。中文特化的知识，比如说写国内公文，小说等应该是R1更优， Claude还是有较明显的英文式中文的感觉。但是burnout我还是喜欢找Claude倒垃圾。Claude的指令理解断档领先。目前应该有一个共识：如果问题定义清晰明确，那么AI已经几乎要做到和人类顶尖一样好了。但最大的问题就是现实问题多数定义很不明确，有的你甚至找不到问题。这导致用户的发问，深究之后会发现其实非常垃圾，因为缺失了大量信息（想想产品经理）。和Claude对话你会感觉她好像真的有点理解你想问什么（藏在文字背后的问题），因此不必反复解释你的prompt。
我觉得这些细节最能见真情。不过照顾人类用户体验可能不是deepseek的首要目标，他们应该更追求模型的上限。

卡卡 · 发表于 2025-1-31 15:13

我用经典的农夫动物过河问题做了一些测试，但是做了一些修改，使用的是DeepSeek “深度思考(R1)”模型。
补充说明：每次提问都是在一个新会话中进行，以避免上下文影响。
原始的经典问题是：
A farmer with a wolf, a goat, and a cabbage must cross a river by boat. The boat can carry only the farmer and a single item. If left alone, the wolf will eat goat, the goat will eat cabbage.
How can they cross the river without anything being eaten?

测试1：移除了问题中的动物食物链依赖，但是deepseek依然强行加上了食物链的依赖约束，当然，对于wolf/goat/cabbage来说，这种联想或许是合适的，所以姑且认为最后结果正确。

测试2：用animal A/B/C来代替具体动物，依然不提供任何食物链约束，deepseek尝试了各种约束条件，甚至船的装载能力，但是它最终依然企图套用经典问题，甚至连答案的步数都强行要求和经典问题一样，最终不出所料，又得出了一个和经典问题类似的答案。我认为本次测试结果错误。

测试3：把动物换成chicken/rabbit/mouse，结果deep seek依然强行往经典问题上靠拢，甚至构造出了&#34;the chicken might eat the mouse&#34;的约束，它为什么一定要去构造约束？因为经典问题是有约束的，而最后的结果不出所料，依然是7步解决问题，和经典问题一样，我认为这次测试的结果失败。

测试4: 在测试2 animal A/B/C 的基础上，显式地加上了关于动物之间关系的约束 &#34;A, B, C don&#39;t eat each other. They can stay together safely.&#34; 这一次，deep seek得到了正确结果，虽然中间过程依然提到了经典的问题。但是这种问法直接否定了经典问题所描述的场景，等于直接阻止deep seek陷入经典问题的训练结果。这是逻辑么？还是本质上依然是对外界直接命令的响应？而最终得出的所谓正确结论，是否不过是来自于某处的另一份训练数据？

以下是ChatGPT的测试结果：

虽然写了5行，但本质上也是7步。
---
从以上测试可以看出，现有的所谓人工智能模型，依然非常依赖训练文本数据，它们会根据训练数据产生一些无中生有的约束，而给出的答案也无法跳出训练数据的范畴。
以上测试只是一些很明显的反例，在其它一些场合，人工智能模型给出的答案可能会隐藏着更不易发觉的错误，带来更大的危害。
与其说它们具有智能，不如说它们只是另一种搜索和模式匹配工具，也许它们可以提升对现有知识的利用效率，但所谓的逻辑推理能力，或许只是我们对这种似是而非的文字排列一厢情愿的期盼。
我赞同人类的智能离不开后天习得的知识，但那就是全部么？我不认为智能只是知识的综合，智能的主因或许不在外部知识，而在于智能体本身。外部知识只是一种唤醒智能的手段，而唤醒的成本，以及所能唤醒的智能上限，取决于智能体本身。
最后是一点个人对当前AI热潮的看法：
LLM所依赖的数学工具，比如linear algebra, probability theory, analysis... 是否足以描述intelligence？在算力和电力供应方面的大规模投入，是否能带来预期的收益？对于这些问题，即便不是悲观，我也不感到乐观，至于deep seek所说的通用人工智能(AGI)，我觉得按照现行技术路线，即便不是不可能，也是非常遥远。

继续前进 · 发表于 2025-1-31 15:14

结合刚才Dario Amodei的文章，来谈谈我对DeepSeek看法，谦虚使人进步。
①Sonnet 3.5是一年前开始训练的模型，DeepSeek V3至少晚了半年多。V3大概是秋季开始做得后训练。咱有一说一，V3代码和角色扮演上的能力，与Sonnet是有差距的。Sonnet依然是裸模代码王。而且Sonnet一直占据着GPQA的裸模王者。这是V3的预训练落后的地方。同样的，V3也比不上最新的GPT-4o和Gemini 2。
②如果Sonnet 加上同等规模的RL，那吃吃DeepSeek R1，OpenAI o1会非常轻松。不要认为V3+R1已经暴打美国了，其实根本就没有。
③国内包括DeepSeek，依然没有自成体系的后训练大法，整得非常凌乱，非常拼凑，非常平庸。DS比较猛的地方是，它……(算了，不说了)。 ——很多人对DeepSeek的风格印象很深刻，这几天网上夸DS的也是它的风格和领会能力——可见，大家玩模的品味有了很大的进步，你整个豆包，文心一言，Kimi什么，这是要来糊弄鬼吗？谁tm现在还玩脑筋急转弯啊。—— 但DeepSeek有没有真实的后训练能力？我认为除了比较激进的RL，其他能力都是不足的，没有找到方法论，也没遇到真正懂意图领会，风格拿捏的人才。如果DS要长时间玩下去，要被友商真正看得起，就要有自己的后训练方法论。

感恩由您 · 发表于 2025-1-31 15:14

不足之处是训练资料大量使用ChatGPT的早期版本，ChatGPT随时随刻在进化，但DeepSeek是截取ChatGPT某个时间点为终点进行大量训练后发布的，这就意味着DeepSeek的答案永远落后于ChatGPT很长一段时间。即使DeepSeek随时训练自己跟上ChatGPT，但它提供的答案结果准确率也无法超越最新的ChatGPT。
   我是怎么发现这一点的：我偶然想起自己在ChatGPT刚推出时（回忆大概在2023年底或2024年初初）曾经询问ChatGPT“我家附近的乒乓球室”，答案出来好几个地方，但这些地方我去验证了一下，发现大部分是错的，即实地并不是乒乓球室，或没有乒乓球桌。
然后今天我用同样的问题去询问DeepSeek，“我家附近”直接改成所在城镇名，结果DeepSeek给出的答案居然和约一年前ChatGPT的答案有相同错误的地址。
然后我改问DeepSeek该城镇附近的乒乓球俱乐部，它干脆给我一堆虚假地址（即虚假的商家名称，或在地图上输入名牌号码后发现根本不是乒乓球俱乐部）。
我重新询问ChatGPT我家附近的乒乓球俱乐部，现在ChatGPT给出的答案经过验证都是正确的。
我认为DeepSeek的训练材料应该不止用ChatGPT的，而是市面上的其它AI产品都用了。有人一直说ChatGPT等美国AI也会用国内AI的训练材料，我认为这确实是可信的。但完全使用别人的输出来训练自己的产品，从而造成成本极低，这值得吹嘘吗？ChatGPT在简中世界中使用国内的AI来训练，是因为它能接触的简中资料渠道狭小，但它本身是采集了大量原始的英文资料来进行初始训练的，这样成本当然会奇高。如果从现在开始，大家都互相靠对方的输出来训练，那么后果是什么？大家的成本是大大降低了，但AI的智商将永远停止。
   搞研发还卷省钱，这非常可笑且无智。这等于在扼杀研发，毕竟不研发，就可以一分钱不花。
   我认为AI界最终会推出法规限制这种互相抄袭的现象。

图文播报

[分享] DeepSeek获得了空前的成功，那他有没有什么不足之处？

登陆有奖并可浏览互动！

发表回复

浏览过的版块

官方推荐 /3

个人中心