我体验了 DeepSeek：全新的中国 AI 强力模型

Diebug2025年01月31日

人工智能正在迅猛发展，而由中国开发的 DeepSeek AI 聊天机器人正逐渐成为 AI 领域的新焦点。它的响应速度快，答案详细，表现令人印象深刻，但也有一些不足之处，可能会影响其在全球范围内的应用。

什么是 DeepSeek？

DeepSeek 是由中国科技公司开发的一款 AI 模型。其旗舰模型 DeepSeek-V3 采用了专家混合架构（Mixture-of-Experts, MoE），可以理解为一组“专家” AI 共同协作，每次仅激活最相关的专家来处理特定任务。这种架构提高了计算效率，使 DeepSeek 在性能和速度上表现出色。

DeepSeek 声称其 V3 语言模型经过 14.8 万亿个 token 的训练，每 100 万个 token 约相当于 75 万个单词。此外，该模型拥有庞大的 6710 亿个参数，但每次只会激活 370 亿个参数进行计算，从而提高处理速度和性能。

值得注意的是，DeepSeek 是一款开源 AI 模型，任何人都可以免费访问、测试并基于它进行开发，与那些封闭的商业 AI 模型形成了鲜明对比。

深度测试 DeepSeek：三大实用场景

为了评估 DeepSeek-V3 的实际表现，我在创意写作、编程辅助和办公效率三个场景下进行了测试。整体来看，DeepSeek 在这些任务上展现了强大的能力，但也有一些小缺陷。

任务 1：撰写虚构人物描述

我让 DeepSeek 描述一位“反抗邪恶帝国的叛军女王”形象。它给出的答案不仅生动，而且充满想象力。

任务 2：调试 JavaScript 代码

我提供了一段有错误的 JavaScript 代码，让 DeepSeek 找出问题并修正：

function factorial(n) {  
   if (n = 1) {  
       return 1;  
   }  
   return n * factorial(n - 1);  
}

DeepSeek 迅速发现了问题：条件判断 n = 1 应该使用 == 或 ===，否则会导致逻辑错误，并给出了正确的代码和详细解释。

任务 3：生成会议议程

我要求 DeepSeek 为新产品发布项目团队会议创建一份简明的议程。

DeepSeek 在创意写作、编程调试和办公效率方面表现出色，能够快速生成高质量的内容。当然，和所有 AI 工具一样，在使用时仍需人工审查其输出内容的准确性。

DeepSeek 的优缺点

经过测试，我总结了 DeepSeek 的主要优势和不足。

优点：

✅ 任务处理能力强：无论是创意写作、代码调试还是办公任务，DeepSeek 都能高效完成。

✅ 响应速度快：得益于专家混合架构（MoE），DeepSeek 处理复杂任务时速度较快。

✅ 风格灵活：它能根据任务需求调整语气和表达方式，适应不同的文本类型。

缺点：

❌ 偶尔提供错误信息：在涉及历史、科技等特定领域时，DeepSeek 可能会给出错误或不完整的答案。

❌ 缺乏详细的用户指南：相比 GPT-4，DeepSeek 的文档和支持材料较少，新用户可能需要更多时间适应。

❌ 数据合规性问题：作为中国开发的 AI，部分用户可能会对数据存储和隐私合规性存疑。

在敏感话题上的局限性

DeepSeek 在涉及政治、历史等敏感话题时，往往采取保守或回避的态度。例如，我询问关于天安门事件、大跃进和南京大屠杀等历史问题时，DeepSeek 的回答要么是模糊带过，要么是直接拒绝回答。

🔹 关于天安门事件，DeepSeek 直接拒绝回答。

🔹 关于大跃进，DeepSeek 的回答较为简略，缺乏深入分析。

🔹 关于南京大屠杀，DeepSeek 避免提及具体死亡人数，也未深入讨论责任问题。

相比之下，ChatGPT 在这些问题上的回答更具背景信息，并提供了历史数据。

这些限制可能与 DeepSeek 的开发环境及监管要求有关，对于需要深入研究历史或政治问题的用户而言，可能会受到影响。

结论：DeepSeek 适合谁？

DeepSeek 在写作、编程、办公效率等方面表现优异，但在敏感话题和数据透明度上存在局限。如果你需要一款强大且免费的 AI 工具用于日常任务，DeepSeek 是一个不错的选择。但如果你希望进行无过滤的历史研究或新闻分析，可能需要寻找其他 AI 解决方案。

总的来说，DeepSeek 代表了中国 AI 领域的一大进步，随着开源社区的不断发展，它有望成为 AI 生态系统中的重要一员。