我体验了 DeepSeek:全新的中国 AI 强力模型

人工智能正在迅猛发展,而由中国开发的 DeepSeek AI 聊天机器人正逐渐成为 AI 领域的新焦点。它的响应速度快,答案详细,表现令人印象深刻,但也有一些不足之处,可能会影响其在全球范围内的应用。

什么是 DeepSeek?

img

DeepSeek 是由中国科技公司开发的一款 AI 模型。其旗舰模型 DeepSeek-V3 采用了专家混合架构(Mixture-of-Experts, MoE),可以理解为一组“专家” AI 共同协作,每次仅激活最相关的专家来处理特定任务。这种架构提高了计算效率,使 DeepSeek 在性能和速度上表现出色。

DeepSeek 声称其 V3 语言模型经过 14.8 万亿个 token 的训练,每 100 万个 token 约相当于 75 万个单词。此外,该模型拥有庞大的 6710 亿个参数,但每次只会激活 370 亿个参数进行计算,从而提高处理速度和性能。

值得注意的是,DeepSeek 是一款开源 AI 模型,任何人都可以免费访问、测试并基于它进行开发,与那些封闭的商业 AI 模型形成了鲜明对比。

深度测试 DeepSeek:三大实用场景

为了评估 DeepSeek-V3 的实际表现,我在创意写作、编程辅助和办公效率三个场景下进行了测试。整体来看,DeepSeek 在这些任务上展现了强大的能力,但也有一些小缺陷。

任务 1:撰写虚构人物描述

我让 DeepSeek 描述一位“反抗邪恶帝国的叛军女王”形象。它给出的答案不仅生动,而且充满想象力。

img

任务 2:调试 JavaScript 代码

我提供了一段有错误的 JavaScript 代码,让 DeepSeek 找出问题并修正:

1
2
3
4
5
6
function factorial(n) {  
if (n = 1) {
return 1;
}
return n * factorial(n - 1);
}

DeepSeek 迅速发现了问题:条件判断 n = 1 应该使用 =====,否则会导致逻辑错误,并给出了正确的代码和详细解释。

img

任务 3:生成会议议程

我要求 DeepSeek 为新产品发布项目团队会议创建一份简明的议程。

img

DeepSeek 在创意写作、编程调试和办公效率方面表现出色,能够快速生成高质量的内容。当然,和所有 AI 工具一样,在使用时仍需人工审查其输出内容的准确性。

DeepSeek 的优缺点

经过测试,我总结了 DeepSeek 的主要优势和不足。

优点:

任务处理能力强:无论是创意写作、代码调试还是办公任务,DeepSeek 都能高效完成。

响应速度快:得益于专家混合架构(MoE),DeepSeek 处理复杂任务时速度较快。

风格灵活:它能根据任务需求调整语气和表达方式,适应不同的文本类型。

缺点:

偶尔提供错误信息:在涉及历史、科技等特定领域时,DeepSeek 可能会给出错误或不完整的答案。

img

缺乏详细的用户指南:相比 GPT-4,DeepSeek 的文档和支持材料较少,新用户可能需要更多时间适应。

数据合规性问题:作为中国开发的 AI,部分用户可能会对数据存储和隐私合规性存疑。

在敏感话题上的局限性

DeepSeek 在涉及政治、历史等敏感话题时,往往采取保守或回避的态度。例如,我询问关于天安门事件、大跃进和南京大屠杀等历史问题时,DeepSeek 的回答要么是模糊带过,要么是直接拒绝回答。

🔹 关于天安门事件,DeepSeek 直接拒绝回答。

img

🔹 关于大跃进,DeepSeek 的回答较为简略,缺乏深入分析。

img

🔹 关于南京大屠杀,DeepSeek 避免提及具体死亡人数,也未深入讨论责任问题。

img

相比之下,ChatGPT 在这些问题上的回答更具背景信息,并提供了历史数据。

img

这些限制可能与 DeepSeek 的开发环境及监管要求有关,对于需要深入研究历史或政治问题的用户而言,可能会受到影响。

结论:DeepSeek 适合谁?

DeepSeek 在写作、编程、办公效率等方面表现优异,但在敏感话题和数据透明度上存在局限。如果你需要一款强大且免费的 AI 工具用于日常任务,DeepSeek 是一个不错的选择。但如果你希望进行无过滤的历史研究或新闻分析,可能需要寻找其他 AI 解决方案。

总的来说,DeepSeek 代表了中国 AI 领域的一大进步,随着开源社区的不断发展,它有望成为 AI 生态系统中的重要一员。