发布日期:2025-02-02 17:58 点击次数:95
彭博社深入剖析 DeepSeek:中国 AI 黑马为何能引发全球关注?
凤凰网科技
2025 年 01 月 27 日 23:32:30 来自北京市
57 人参与10 评论

DeepSeek
凤凰网科技讯 北京时间 1 月 27 日,彭博社周一发文称,中国 AI 创业公司 DeepSeek ( 深度求索 ) 成立只有一年多时间,但它的 AI 模型已经取得了突破性进展,性能堪比世界上最出色的聊天机器人,成本却似乎远低于后者,这让美国硅谷感到震惊。
彭博社指出,DeepSeek 的异军突起可能与之前的一种普遍看法相悖。此前,业界普遍认为 AI 的未来发展需要源源不断的算力和能源投入作支撑。随着 DeepSeek 的创新引发的热潮不断升温,投资者开始消化它对美国竞争对手及其硬件供应商的影响,全球科技股在本月底大跌。
DeepSeek 到底是什么?
DeepSeek 由量化基金幻方量化负责人梁文峰于 2023 年创立。该公司开发的 AI 模型是开源的,这意味着整个开发人员社区都可以检查和改进软件。其移动应用在 1 月初发布后,在美国 iPhone 下载排行榜上飙升至榜首。
该应用程序与 OpenAI 的 ChatGPT 等其他聊天机器人的区别在于,在对提示做出响应之前阐明其推理。该公司声称其 R1 版本提供的性能与 OpenAI 的最新版本相当,并已向有兴趣使用该技术开发聊天机器人的个人授予许可。
DeepSeek R1 与 OpenAI 或 Meta 的模型相比如何?
虽然 DeepSeek 并未全面披露其 R1 新模型的细节,但该模型的训练和开发成本似乎仅为 OpenAI 或 Meta 最强产品的一小部分。R1 的效率显然要高得多,这不禁让人质疑业界是否仍需要投入大量资金去购买英伟达等公司的最新、最强大的 AI 加速器。这也让外界更加关注美国针对中国的先进 AI 芯片出口管制,因为这些管制就是为了防止中国取得像 DeepSeek 这样的突破。
DeepSeek 表示,R1 模型在几个主要基准测试中的表现接近或超越了竞争对手的模型,例如测试数学能力的 AIME 2024、测试常识的 MMLU 和测试问答性能的 AlpacaEval 2.0。它还在加州大学伯克利分校研究生开发的 AI 系统排名网站 Chatbot Arena 上名列前茅。
DeepSeek 何时引发了全球关注?
自从 2023 年发布最早模型以来,DeepSeek 就一直备受关注。去年 11 月,它向世界预览了旨在模仿人类思维的 DeepSeek R1 推理模型,为其移动聊天机器人应用提供了技术支持。再加上网页版,该聊天机器人迅速成为全球知名的廉价 OpenAI 替代品。硅谷知名投资人马克 · 安德森 ( Marc Andreessen ) 称其为" AI 的斯普特尼克时刻"(源自冷战时期的历史术语,现已成为一种隐喻,用来描述某个事件或时刻引发强烈的危机感或紧迫感,促使国家、组织或个人采取行动以应对竞争或挑战)。

DeepSeek 的应用图标
根据市场追踪公司 App Figures 的数据,截止到今年 1 月 25 日,DeepSeek 移动应用已被下载 160 万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的 iPhone 应用商店中排名第一。
DeepSeek 的创始人是谁?
DeepSeek 创始人是梁文锋 1985 年出生于广东,浙江大学电子与信息工程学士和硕士学位。公开信息显示,他以 1000 万元人民币的注册资本创立了 DeepSeek。
梁文峰在接受媒体采访时表示,进一步进步的瓶颈不是更多的融资,而是美国对获得最佳芯片的限制。他说,他的大多数顶尖研究人员都是来自中国顶尖大学的应届毕业生,并强调中国需要发展自己的国内生态系统,类似于围绕英伟达及其人工智能芯片构建的生态系统。
梁文峰指出,"更多的投资不一定会带来更多的创新。否则,大公司将包揽所有创新。"
DeepSeek 在中国 AI 行业处于何种地位?
从阿里巴巴集团、百度到腾讯,中国的科技巨头都投入了大量资金和资源,为各自的 AI 模型争夺硬件和客户。和李开复的零一万物一样,DeepSeek 凭借其开源策略脱颖而出。该策略旨在快速吸引最多的用户,然后在庞大用户基础上制定创收策略。
由于 DeepSeek 的模型更实惠,它已经在协助降低中国 AI 开发商的成本。在过去一年半时间里,其他规模更大的公司已经在中国打起了价格战,出现了连续的降价浪潮。
它对全球 AI 市场有什么影响?
DeepSeek 的成功可能会促使 OpenAI 和其他美国 AI 供应商降低价格,以保持其现有领先地位。这也让人们对 Meta、微软等公司的巨额支出产生质疑。这些公司已经分别承诺将在今年投入 650 亿美元或更多的资本支出,主要用于 AI 基础设施。如果效率更高的模型能够用更少的投入与现有的模型竞争,那么它就会对传统的大规模资金投入模式构成挑战。
DeepSeek 崛起还引发了全球股市动荡。投资者开始抛售英伟达、阿斯麦等受益于 AI 服务需求激增的公司股票。科大讯飞等与 DeepSeek 有关的中国公司股价则出现上涨。
全球开发者已经在尝试使用 DeepSeek 的软件,并希望基于它开发工具。这可能加速先进 AI 推理模型的普及,同时也可能引发更多担忧,那就是该如何围绕着它的使用设立护栏。DeepSeek 取得的进展可能促使相关法规的出台,以控制 AI 的开发方式。
有何短板?
DeepSeek 的云基础设施可能会因其模型的突然走红而受到考验。1 月 27 日,该公司就经历了一次短暂的大宕机。随着新老用户向其聊天机器人提出更多问题,DeepSeek 将不得不应对更大的流量。 ( 作者 / 箫雨 )