当前位置：首页 > 新闻资讯 > 正文内容

打破算力迷信 DeepSeek火出圈这一波为何大厂“掉队”了?

七夏1周前 (02-14)新闻资讯50

　　闪极科技CTO　潘欣

　　中国科学院科技战略　　咨询研究院研究员　周城雄

　　硅基智能创始人　　兼CEO　司马华鹏

　　蛇年伊始，DeepSeek如平地惊雷般引发空前讨论，成为资本市场关注焦点，相关概念股节后表现强劲。DeepSeek不仅在技术上取得了显著突破，还在多个行业展现了巨大应用潜力，吸引一众云厂商、车企、手机企业官宣“接入”DeepSeek。

　　在此背景下，南方都市报“上岗了!AI”课题组邀请到硅基智能创始人兼CEO司马华鹏，中国科学院科技战略咨询研究院研究员周城雄，以及闪极科技CTO潘欣参加了线上沙龙，针对DeepSeek冲击波可能造成哪些影响、DeepSeek是否为中国弯道超车美国的重要节点、DeepSeek将带来哪些行业影响和职业新机遇、新挑战等问题展开研讨。

　　侧重推理

　　“DeepSeek是新的标杆型模型”　　

　　司马华鹏认为，DeepSeek的出圈预示着开源的胜利。“从OpenAI推出ChatGPT至今，你能看到所有公司都在追赶，追赶的方式既有开源也有闭源，这一次DeepSeek的火爆有点像是开源社区下，大家一起推动出来的胜利，我觉得它是一种新的组织形态的胜利。”

　　此前有公开报道曾指出，DeepSeek-V3的训练成本仅为GPT-4的1/20。在此次圆桌讨论中，谈及DeepSeek的出圈，多位嘉宾都提到其成本效应。司马华鹏提到，任何科技创新的前期研发成本都比较高，后期一旦到达一个临界点就会启发大量应用，DeepSeek的横空出世就踏在这一临界点上，而今年有望成为大模型大规模落地的节点。同时，DeepSeek也戳穿了“唯大力出奇迹”“算力越强模型越好”的行业“成规”。

　　谈及DeepSeek的破圈因素时，潘欣则认为DeepSeek-R1是GPT-o1后首个专攻模型推理阶段的标杆型开源模型。“目前关键的开源大模型有几个，包括Meta的LLaMA、阿里的千问。但和其他开源大模型不同的是，近期火爆的DeepSeek专攻的领域是模型推理阶段。GPT-o1出来后，大家的关注重点已经从预训练逐渐往推理阶段转换，在这个转换过程中，一直没有一个标杆型的开源模型跑出来，包括LLaMA和千问也只是在对标预训练时代最好的成果而已。因此，DeepSeek可以看作是新的技术范式下新的标杆型模型，在效果上已经达到了GPT-o1的水平。”

　　面对DeepSeek的爆火，中国科学院科技战略咨询研究院研究员周城雄表示，DeepSeek是算法和算力的一次关键突破。“计算能力是科技水平的一个重要标志，计算速度越快、计算能力越强，人类的科技水平越高。从国家层面、人类社会层面来说都一样，当你能够处理的信息越多，说明科技水平就越高。”

　　成本效应

　　“DeepSeek将促AI应用市场爆发”　　

　　DeepSeek的成本效应会带来哪些影响?司马华鹏认为，企业做大模型落地时一定会考量模型的投入产出比，比如大家将珍贵的算力交给算法，生产出来的东西卖掉以后能否覆盖掉最初的投入?此前，有很多大模型应用都出现了算力投入大、产出低于投入的亏本情况。此次，DeepSeek让行业成本下降了80%-90%是一次里程碑事件，尽管当中有模型蒸馏带来的成本下降，但其将精力放在推理端而不是预训练端的强化学习上，也启发了不少从业者。

　　同时，司马华鹏还提到，DeepSeek影响行业在算法算力上布局的同时，也加速了行业的开源，比如近期OpenAI就开放了一些免费选项，谷歌也做了不少开源。对于中国企业而言，DeepSeek的成本效应也让很多创业公司看到了希望。“现在卡住我们的不是算法，而是算力，如果我们能把国产算力包括创业公司的GPU都用上的话，那对美国很可能是非常大的挑战。”

　　潘欣认为，DeepSeek此次的应用改进，明显会带来应用侧的爆发。这种爆发传递到算力侧，全球或将也迎来算力需求的井喷。“可以预想到，当单次推理的token成本降到一定阈值时，很多应用就可以被解锁。比如一些偏社交类的应用、偏长时间开启的应用，像监控摄像头、自动驾驶、机器人等需要长时间推理的应用，都可以通过大幅的基础模型成本降低来解锁，从而进一步促进AI应用市场的爆发；另外，从开源角度看，DeepSeek开源后，大量下游应用公司在没有足够成本去做模型时，也可以拿到原始模型参数去做类似李飞飞团队(美国斯坦福大学和华盛顿大学研究人员)‘50美金复刻DeepSeek模型’的微调，这也将进一步促进应用的爆发。随着应用的爆发，对全球算力的总体需求可能也会增加。就像当年油和煤的开采成本下降，反而导致总体煤油需求的井喷。”

　　另外，周城雄还提到，DeepSeek的成本效应具有商业优势，或将促进大规模商业化时代的到来。“其实商业的逻辑就是成本竞争，我认为价格竞争就是商业竞争的终极逻辑，没有价格优势就不会有商业优势。同样的服务或同样的产品，价格优势就是最大优势，人类的科技进步和商业竞争多次证明了这一点。DeepSeek成本快速下降会导致消费者迅速增加，未来我们可以用极低的价格享受人工智能带来的好处。”

　　模式出圈

　　“Deepseek让大家回归创新常识”　　

　　过去近一个月间，经过媒体广泛报道与挖掘，一种重视创新、采用扁平化架构、采用顶尖人才战略的“Deepseek模式”逐渐呈现在大众面前。此前Deepseek创始人梁文锋在接受媒体采访时曾提到，Deepseek让硅谷惊讶的原因，是这是一个中国公司在以创新贡献者的身份，加入到他们的游戏里去。“过去三十年，我们太强调商业化了，对创新有时候是忽视的。创新不完全是商业驱动的，还需要好奇心和创造欲。而中国企业创新缺的肯定不是资本，而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

　　在“Deepseek模式”出圈后，行业重视商业化、轻研发创新的现状会改变吗?周城雄认为，当个别人这样做时可能是不理性的，但当出现群体效应时，这可能就是一个理性行为。“如果目前的创业环境中，变现比较快、离应用比较近的企业才能存活下去，大家就会选择做这个事。我认为归根结底还是科研生态的问题。目前的生态还有很大的改善和提升空间，也还是需要时间，不是说DeepSeek出来后就能快速改变整个生态。”

　　潘欣表示，DeepSeek包括相关公司的创新将成本降下来、将基础模型开源出来后，为行业内的公司提供了更丰富的土壤和更好的机会。“比如我是做眼镜的，我觉得AI眼镜可能在今年也会有比较大的机会，我们把大模型的推理和智能体以及多模态进行结合。通过每个人平时佩戴的眼镜，能够让AI随时都陪伴在人的身边，随时给人提供辅助，帮助人记录，让每个人都能过目不忘。另外包括在软件开发层面，可能未来我们可以通过智能体AI的方式去构建新的下一代的软件。”

　　谈及Deepseek的创新，多位嘉宾还是提到了Deepseek坚持创新必不可少的是其雄厚的资本能力，比如至今还没融资、很早就有几万张H100卡的储备等因素，这些都让Deepseek的续航焦虑得以缓解。但司马华鹏也提到，DeepSeek坚持将钱都应用到研发上，最终做成了这件事，这样的创业团队和氛围会让大家回归创新、创业的常识。

　　在DeepSeek首先破圈跑出来对标GPT-o1的深度思考模型后，不少人也在质疑为何大厂没有率先做到这件事。潘欣认为，大厂的组织架构很难将人才和资源完全聚焦。“AI研发特别是大模型研发是一个偏精英化的研发项目，它不是靠堆人去完成的，而且堆的人越多可能这个事情就做得越慢。它需要少量的、核心的人去拍板技术路线和做决策，像OpenAI也是靠很少量的高手去把这个东西做出来。如果要在互联网大厂里去做这种团队的精英化聚焦，可能需要从大厂的各个部门调派(人员)过来、经过多个层级的层层决策，很难做到这样的扁平组织化。另外再比如说可能还会有算力的审批，比如大厂里有20个团队都想做AI，那么算力也需要审批和给每个团队分。但你会看到DeepSeek可以直接高效地聚焦资源，比如优先去做文本类的聚焦，不会把资源分散到语音识别、文生视频等方面。”

　　司马华鹏提到，大厂的预算和财务模型一定会使它更支持更大的市场，而那些短期看不到的市场则会在决策中被放弃。“比如说开源这件事，不是所有的大厂都愿意去做。但开源精神现在已经成为中国的大转折点，后续可能会有大量的创业公司脱颖而出。也期待大家能继续把中国最先进的东西推到全世界，让全世界都受益于中国崛起所带来的这种知识平权、科技平权。而不是让知识和科技最后都被垄断，让少数公司实现巨额利润。”

　　周城雄也认为，大厂到了一定体量后，创新和决策的效率都非常低，而小公司拥有“船小好调头”的优势，同时它们会不断生产消灭促进生态往前发展，在这个过程中总会跑出来一些企业。

　　同时他还提到，DeepSeek的成功并不是其单个公司的成功，而是硅谷式科研金融产业生态模式的成功。“我相信在硅谷有很多类似DeepSeek这样相对小规模、低成本、聚焦很多优秀年轻人的公司在做这样的事。中国未来要诞生更多像DeepSeek这样的公司，在科技金融方面多借鉴硅谷模式，可能是一个突破方向。”

　　谨慎乐观

　　“说是弯道超车美国的节点为时尚早”　　

　　尽管DeepSeek在近期引起了强烈关注，被不少网友称为“国产之光”，但多位嘉宾在圆桌讨论中皆指出，要说这就是中国弯道超车美国人工智能行业的重要节点，可能还为时尚早。

　　潘欣提到，在模型的成本上，DeepSeek花的钱比硅谷的公司要少很多，比Google、OpenAI等花的钱是数量级地更少。这背后的原因是，不少硅谷的创业公司可能走在更前沿的探索中。“当你站在全球最前沿的时候，你的前面是没有答案的，所以你需要做海量的实验和试错。现在这部分成本其实是被美国硅谷的公司覆盖掉的，他们走在前面，这里面可能有相对上百倍甚至上千倍更多的成本消耗，大量的实验可能就是无用的，最终才找到某几个可以走的路径。目前，国内的情况是，在硅谷大创新基础上做了小创新，应该说，当前的状态是紧跟硅谷一线的水平。”

　　要做到弯道超车，潘欣认为目前还要解决算力和资本方面的问题。“如果你想超车，你必然要走到前面，走到前面必然要付出更大的算力成本去做很多试错，这样就要求算力的自主可控和成本下降，这可能还是一个更大的卡脖子的点；另外在资本上，其实前沿技术还是一种‘大力出奇迹’的情况，在资本的加持下去做创新和实验还是不可或缺的。”

　　司马华鹏认为，目前中美在人工智能领域中并不是互相赶超，而是齐头并进，这对于整个世界领域来讲是一种良性竞争。他还提到，未来真正的竞争并不发生在中美之间，而有可能出现在硅基生命与碳基生命之间。“我觉得人类真正的威胁，最后是硅基生命的威胁，大家也看过美国好莱坞有像《黑客帝国》这样的电影。未来AI实现自我进化和自我意识以后，对我们人类而言不再是带来简单的文化的影响，而是一种新的文明的影响，比如今天DeepSeek让人震撼的是它回答的时候带有非常多人格化的特征，就像是你周围一个非常聪明的朋友。”

　　周城雄提到，DeepSeek进一步提升了人类信息处理能力，并不意味着中国就能一直处于领先地位。“人类社会知识在不断迭代，计算能力也肯定不断进步的。就像我们算乘法除法的算式，人类可能用了几十年或者说上百年，要是没有算盘出现、没有计算激活，我们的计算方法还处在列竖式的水平。不可能用一次进步就一直处于领先地位，目前DeepSeek的算法是先进的，但在开源的情况下，新算法的出现速度可能也会快很多。”

　　行业冲击

　　“开发AI的程序员或被最先取代”　　

　　司马华鹏认为，大模型或者人工智能产业的核心是知识传递，医疗、教育、金融、咨询等以知识传递为核心的行业可能会受到很大的冲击，它们在知识的不对称上变成了被冲破的堡垒。“我们说工业革命是让普通女性能穿上女王才有的丝袜，今天大模型的革命是让每个人拥有服务，比如以前领导才有人帮忙写稿子，今天我有了AI私人助理；以前有钱人才有私人健康顾问，现在我也有AI帮我做这件事。”

　　潘欣认为，像DeepSeek-R1、GPT-o1等思考推理能力更强的AI出来后，偏思考相关、重逻辑推理的行业会首先受到冲击。“其中最典型的应该是开发这些东西的程序员，我们会真切地感受到，三五年前需要十个人开发的项目，今天可能一两个人就能够解决了，这种感受还会进一步加强，也可能延伸到相关行业。比如AI之前只能帮大家润色文章，现在已经可以帮人写研报了，思考推理模型可以不断从网上搜索资料、调研分析、进一步搜索、进一步迭代，所以文字岗位也会有很大风险。”

　　周城雄认为，像DeepSeek这样的AI大模型产品，主要是基于编码化知识而形成的，最容易替代的是对显性知识进行组合或搬运的工作者，目前一些隐性知识的工作者还比较难被替代。另外依靠高强度高密度计算思考的科研工作者也会受到影响。

　　同时多位嘉宾还提到，新的工作机会也会出现。周城雄表示，更多来自服务业的机会或将被催生。“未来人们需要劳动动脑的时间少了，可能需要享受服务的时间也会增加，服务业的需求也许也会更多。就像在前几次工业革命之后，发达国家实现了工业化、自动化后，服务业占GDP的比重会上升。”

　　司马华鹏坚信，DeepSeek这样的模型出现后会进一步促进信息平权。“其实我们去年到今年做了非常多的专家模型，像经济学家任泽平被我们用大模型学习出来，他的私有知识也授权被我们训练成一个模型，你可以实现随时跟任泽平博士实时视频聊天或对话，这就是一种知识平权，就算是来自孟加拉国偏远地区的孩子，都可以通过AI和学者、经济学家交流。而DeepSeek又加剧了这件事情，它整个的表达能力、推理能力和逻辑能力都使得这件事被进一步加深了。”

　　潘欣提到，AI本质上提高了整个社会化的生产力，很多好的商品服务也会变得更便宜，但一些人与人交互的、有温度的服务其实很难被取代。“过年期间我去旅游，很明显地感觉到，其实很多旅游服务业，它不是那么好被AI取代的。在职业选择上，可能下一代人跟我们这一代人会有很大不同，也许没有那么多工作需要去做一些思考逻辑推理了，但还会有更多机会在其他行业和赛道涌现。”

　　策划/统筹:甄芹

　　执行:南都记者林文琪田爱丽

　　主持人:南都政商数据新闻部记者林文琪

　　直播统筹:陈蓓蕾

　　导播:阮增豪

　　设计:尹洁琳

　　制图:董晓妍(即梦AI)