当前位置:首页 > 新闻资讯 > 正文内容

打破算力迷信 DeepSeek火出圈 这一波为何大厂“掉队”了?

七夏1周前 (02-14)新闻资讯50



  闪极科技CTO 潘欣


  中国科学院科技战略   咨询研究院研究员 周城雄


  硅基智能创始人   兼CEO 司马华鹏

  蛇年伊始,DeepSeek如平地惊雷般引发空前讨论,成为资本市场关注焦点,相关概念股节后表现强劲。DeepSeek不仅在技术上取得了显著突破,还在多个行业展现了巨大应用潜力,吸引一众云厂商、车企、手机企业官宣“接入”DeepSeek。

  在此背景下,南方都市报“上岗了!AI”课题组邀请到硅基智能创始人兼CEO司马华鹏,中国科学院科技战略咨询研究院研究员周城雄,以及闪极科技CTO潘欣参加了线上沙龙,针对DeepSeek冲击波可能造成哪些影响、DeepSeek是否为中国弯道超车美国的重要节点、DeepSeek将带来哪些行业影响和职业新机遇、新挑战等问题展开研讨。

  侧重推理

  “DeepSeek是新的标杆型模型”  

  司马华鹏认为,DeepSeek的出圈预示着开源的胜利。“从OpenAI推出ChatGPT至今,你能看到所有公司都在追赶,追赶的方式既有开源也有闭源,这一次DeepSeek的火爆有点像是开源社区下,大家一起推动出来的胜利,我觉得它是一种新的组织形态的胜利。”

  此前有公开报道曾指出,DeepSeek-V3的训练成本仅为GPT-4的1/20。在此次圆桌讨论中,谈及DeepSeek的出圈,多位嘉宾都提到其成本效应。司马华鹏提到,任何科技创新的前期研发成本都比较高,后期一旦到达一个临界点就会启发大量应用,DeepSeek的横空出世就踏在这一临界点上,而今年有望成为大模型大规模落地的节点。同时,DeepSeek也戳穿了“唯大力出奇迹”“算力越强模型越好”的行业“成规”。

  谈及DeepSeek的破圈因素时,潘欣则认为DeepSeek-R1是GPT-o1后首个专攻模型推理阶段的标杆型开源模型。“目前关键的开源大模型有几个,包括Meta的LLaMA、阿里的千问。但和其他开源大模型不同的是,近期火爆的DeepSeek专攻的领域是模型推理阶段。GPT-o1出来后,大家的关注重点已经从预训练逐渐往推理阶段转换,在这个转换过程中,一直没有一个标杆型的开源模型跑出来,包括LLaMA和千问也只是在对标预训练时代最好的成果而已。因此,DeepSeek可以看作是新的技术范式下新的标杆型模型,在效果上已经达到了GPT-o1的水平。”

  面对DeepSeek的爆火,中国科学院科技战略咨询研究院研究员周城雄表示,DeepSeek是算法和算力的一次关键突破。“计算能力是科技水平的一个重要标志,计算速度越快、计算能力越强,人类的科技水平越高。从国家层面、人类社会层面来说都一样,当你能够处理的信息越多,说明科技水平就越高。”

  成本效应

  “DeepSeek将促AI应用市场爆发”  

  DeepSeek的成本效应会带来哪些影响?司马华鹏认为,企业做大模型落地时一定会考量模型的投入产出比,比如大家将珍贵的算力交给算法,生产出来的东西卖掉以后能否覆盖掉最初的投入?此前,有很多大模型应用都出现了算力投入大、产出低于投入的亏本情况。此次,DeepSeek让行业成本下降了80%-90%是一次里程碑事件,尽管当中有模型蒸馏带来的成本下降,但其将精力放在推理端而不是预训练端的强化学习上,也启发了不少从业者。

  同时,司马华鹏还提到,DeepSeek影响行业在算法算力上布局的同时,也加速了行业的开源,比如近期OpenAI就开放了一些免费选项,谷歌也做了不少开源。对于中国企业而言,DeepSeek的成本效应也让很多创业公司看到了希望。“现在卡住我们的不是算法,而是算力,如果我们能把国产算力包括创业公司的GPU都用上的话,那对美国很可能是非常大的挑战。”

  潘欣认为,DeepSeek此次的应用改进,明显会带来应用侧的爆发。这种爆发传递到算力侧,全球或将也迎来算力需求的井喷。“可以预想到,当单次推理的token成本降到一定阈值时,很多应用就可以被解锁。比如一些偏社交类的应用、偏长时间开启的应用,像监控摄像头、自动驾驶、机器人等需要长时间推理的应用,都可以通过大幅的基础模型成本降低来解锁,从而进一步促进AI应用市场的爆发;另外,从开源角度看,DeepSeek开源后,大量下游应用公司在没有足够成本去做模型时,也可以拿到原始模型参数去做类似李飞飞团队(美国斯坦福大学和华盛顿大学研究人员)‘50美金复刻DeepSeek模型’的微调,这也将进一步促进应用的爆发。随着应用的爆发,对全球算力的总体需求可能也会增加。就像当年油和煤的开采成本下降,反而导致总体煤油需求的井喷。”

  另外,周城雄还提到,DeepSeek的成本效应具有商业优势,或将促进大规模商业化时代的到来。“其实商业的逻辑就是成本竞争,我认为价格竞争就是商业竞争的终极逻辑,没有价格优势就不会有商业优势。同样的服务或同样的产品,价格优势就是最大优势,人类的科技进步和商业竞争多次证明了这一点。DeepSeek成本快速下降会导致消费者迅速增加,未来我们可以用极低的价格享受人工智能带来的好处。”

  模式出圈

  “Deepseek让大家回归创新常识”  

  过去近一个月间,经过媒体广泛报道与挖掘,一种重视创新、采用扁平化架构、采用顶尖人才战略的“Deepseek模式”逐渐呈现在大众面前。此前Deepseek创始人梁文锋在接受媒体采访时曾提到,Deepseek让硅谷惊讶的原因,是这是一个中国公司在以创新贡献者的身份,加入到他们的游戏里去。“过去三十年,我们太强调商业化了,对创新有时候是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。而中国企业创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

  在“Deepseek模式”出圈后,行业重视商业化、轻研发创新的现状会改变吗?周城雄认为,当个别人这样做时可能是不理性的,但当出现群体效应时,这可能就是一个理性行为。“如果目前的创业环境中,变现比较快、离应用比较近的企业才能存活下去,大家就会选择做这个事。我认为归根结底还是科研生态的问题。目前的生态还有很大的改善和提升空间,也还是需要时间,不是说DeepSeek出来后就能快速改变整个生态。”

  潘欣表示,DeepSeek包括相关公司的创新将成本降下来、将基础模型开源出来后,为行业内的公司提供了更丰富的土壤和更好的机会。“比如我是做眼镜的,我觉得AI眼镜可能在今年也会有比较大的机会,我们把大模型的推理和智能体以及多模态进行结合。通过每个人平时佩戴的眼镜,能够让AI随时都陪伴在人的身边,随时给人提供辅助,帮助人记录,让每个人都能过目不忘。另外包括在软件开发层面,可能未来我们可以通过智能体AI的方式去构建新的下一代的软件。”

  谈及Deepseek的创新,多位嘉宾还是提到了Deepseek坚持创新必不可少的是其雄厚的资本能力,比如至今还没融资、很早就有几万张H100卡的储备等因素,这些都让Deepseek的续航焦虑得以缓解。但司马华鹏也提到,DeepSeek坚持将钱都应用到研发上,最终做成了这件事,这样的创业团队和氛围会让大家回归创新、创业的常识。

  在DeepSeek首先破圈跑出来对标GPT-o1的深度思考模型后,不少人也在质疑为何大厂没有率先做到这件事。潘欣认为,大厂的组织架构很难将人才和资源完全聚焦。“AI研发特别是大模型研发是一个偏精英化的研发项目,它不是靠堆人去完成的,而且堆的人越多可能这个事情就做得越慢。它需要少量的、核心的人去拍板技术路线和做决策,像OpenAI也是靠很少量的高手去把这个东西做出来。如果要在互联网大厂里去做这种团队的精英化聚焦,可能需要从大厂的各个部门调派(人员)过来、经过多个层级的层层决策,很难做到这样的扁平组织化。另外再比如说可能还会有算力的审批,比如大厂里有20个团队都想做AI,那么算力也需要审批和给每个团队分。但你会看到DeepSeek可以直接高效地聚焦资源,比如优先去做文本类的聚焦,不会把资源分散到语音识别、文生视频等方面。”

  司马华鹏提到,大厂的预算和财务模型一定会使它更支持更大的市场,而那些短期看不到的市场则会在决策中被放弃。“比如说开源这件事,不是所有的大厂都愿意去做。但开源精神现在已经成为中国的大转折点,后续可能会有大量的创业公司脱颖而出。也期待大家能继续把中国最先进的东西推到全世界,让全世界都受益于中国崛起所带来的这种知识平权、科技平权。而不是让知识和科技最后都被垄断,让少数公司实现巨额利润。”

  周城雄也认为,大厂到了一定体量后,创新和决策的效率都非常低,而小公司拥有“船小好调头”的优势,同时它们会不断生产消灭促进生态往前发展,在这个过程中总会跑出来一些企业。

  同时他还提到,DeepSeek的成功并不是其单个公司的成功,而是硅谷式科研金融产业生态模式的成功。“我相信在硅谷有很多类似DeepSeek这样相对小规模、低成本、聚焦很多优秀年轻人的公司在做这样的事。中国未来要诞生更多像DeepSeek这样的公司,在科技金融方面多借鉴硅谷模式,可能是一个突破方向。”

  谨慎乐观

  “说是弯道超车美国的节点为时尚早”  

  尽管DeepSeek在近期引起了强烈关注,被不少网友称为“国产之光”,但多位嘉宾在圆桌讨论中皆指出,要说这就是中国弯道超车美国人工智能行业的重要节点,可能还为时尚早。

  潘欣提到,在模型的成本上,DeepSeek花的钱比硅谷的公司要少很多,比Google、OpenAI等花的钱是数量级地更少。这背后的原因是,不少硅谷的创业公司可能走在更前沿的探索中。“当你站在全球最前沿的时候,你的前面是没有答案的,所以你需要做海量的实验和试错。现在这部分成本其实是被美国硅谷的公司覆盖掉的,他们走在前面,这里面可能有相对上百倍甚至上千倍更多的成本消耗,大量的实验可能就是无用的,最终才找到某几个可以走的路径。目前,国内的情况是,在硅谷大创新基础上做了小创新,应该说,当前的状态是紧跟硅谷一线的水平。”

  要做到弯道超车,潘欣认为目前还要解决算力和资本方面的问题。“如果你想超车,你必然要走到前面,走到前面必然要付出更大的算力成本去做很多试错,这样就要求算力的自主可控和成本下降,这可能还是一个更大的卡脖子的点;另外在资本上,其实前沿技术还是一种‘大力出奇迹’的情况,在资本的加持下去做创新和实验还是不可或缺的。”

  司马华鹏认为,目前中美在人工智能领域中并不是互相赶超,而是齐头并进,这对于整个世界领域来讲是一种良性竞争。他还提到,未来真正的竞争并不发生在中美之间,而有可能出现在硅基生命与碳基生命之间。“我觉得人类真正的威胁,最后是硅基生命的威胁,大家也看过美国好莱坞有像《黑客帝国》这样的电影。未来AI实现自我进化和自我意识以后,对我们人类而言不再是带来简单的文化的影响,而是一种新的文明的影响,比如今天DeepSeek让人震撼的是它回答的时候带有非常多人格化的特征,就像是你周围一个非常聪明的朋友。”

  周城雄提到,DeepSeek进一步提升了人类信息处理能力,并不意味着中国就能一直处于领先地位。“人类社会知识在不断迭代,计算能力也肯定不断进步的。就像我们算乘法除法的算式,人类可能用了几十年或者说上百年,要是没有算盘出现、没有计算激活,我们的计算方法还处在列竖式的水平。不可能用一次进步就一直处于领先地位,目前DeepSeek的算法是先进的,但在开源的情况下,新算法的出现速度可能也会快很多。”

  行业冲击

  “开发AI的程序员或被最先取代”  

  司马华鹏认为,大模型或者人工智能产业的核心是知识传递,医疗、教育、金融、咨询等以知识传递为核心的行业可能会受到很大的冲击,它们在知识的不对称上变成了被冲破的堡垒。“我们说工业革命是让普通女性能穿上女王才有的丝袜,今天大模型的革命是让每个人拥有服务,比如以前领导才有人帮忙写稿子,今天我有了AI私人助理;以前有钱人才有私人健康顾问,现在我也有AI帮我做这件事。”

  潘欣认为,像DeepSeek-R1、GPT-o1等思考推理能力更强的AI出来后,偏思考相关、重逻辑推理的行业会首先受到冲击。“其中最典型的应该是开发这些东西的程序员,我们会真切地感受到,三五年前需要十个人开发的项目,今天可能一两个人就能够解决了,这种感受还会进一步加强,也可能延伸到相关行业。比如AI之前只能帮大家润色文章,现在已经可以帮人写研报了,思考推理模型可以不断从网上搜索资料、调研分析、进一步搜索、进一步迭代,所以文字岗位也会有很大风险。”

  周城雄认为,像DeepSeek这样的AI大模型产品,主要是基于编码化知识而形成的,最容易替代的是对显性知识进行组合或搬运的工作者,目前一些隐性知识的工作者还比较难被替代。另外依靠高强度高密度计算思考的科研工作者也会受到影响。

  同时多位嘉宾还提到,新的工作机会也会出现。周城雄表示,更多来自服务业的机会或将被催生。“未来人们需要劳动动脑的时间少了,可能需要享受服务的时间也会增加,服务业的需求也许也会更多。就像在前几次工业革命之后,发达国家实现了工业化、自动化后,服务业占GDP的比重会上升。”

  司马华鹏坚信,DeepSeek这样的模型出现后会进一步促进信息平权。“其实我们去年到今年做了非常多的专家模型,像经济学家任泽平被我们用大模型学习出来,他的私有知识也授权被我们训练成一个模型,你可以实现随时跟任泽平博士实时视频聊天或对话,这就是一种知识平权,就算是来自孟加拉国偏远地区的孩子,都可以通过AI和学者、经济学家交流。而DeepSeek又加剧了这件事情,它整个的表达能力、推理能力和逻辑能力都使得这件事被进一步加深了。”

  潘欣提到,AI本质上提高了整个社会化的生产力,很多好的商品服务也会变得更便宜,但一些人与人交互的、有温度的服务其实很难被取代。“过年期间我去旅游,很明显地感觉到,其实很多旅游服务业,它不是那么好被AI取代的。在职业选择上,可能下一代人跟我们这一代人会有很大不同,也许没有那么多工作需要去做一些思考逻辑推理了,但还会有更多机会在其他行业和赛道涌现。”

  策划/统筹:甄芹

  执行:南都记者 林文琪 田爱丽

  主持人:南都政商数据新闻部记者 林文琪

  直播统筹:陈蓓蕾

  导播:阮增豪

  设计:尹洁琳

  制图:董晓妍(即梦AI)

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/89193.html

分享给朋友:

“打破算力迷信 DeepSeek火出圈 这一波为何大厂“掉队”了?” 的相关文章

69岁教育部原副部长杜玉波被查,上个月还曾给高校领导授课

69岁教育部原副部长杜玉波被查,上个月还曾给高校领导授课

9月18日,据中央纪委国家监委消息,教育部原党组副书记、副部长杜玉波涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。红星新闻记者注意到,就在上月,69岁的杜玉波还曾在江西全省高校党委书记校长提高政治能力专题研讨班上授课。▲杜玉波 图据云南大学...

中秋送温暖,广东多地民政部门开展关怀慰问活动

中秋送温暖,广东多地民政部门开展关怀慰问活动

南都讯 记者曾俊豪 月满中秋,情满人间。回顾2024年中秋节,广东省多地民政部门通过入户走访、物资发放、开展主题活动等多样形式,积极链接社会资源,关心关爱困难群众,为服务对象送上节日祝福和浓浓关怀。在汕尾市海丰县,当地民政部门开展“入户联心”活动,联合各镇儿...

黎巴嫩传呼机对讲机爆炸 15死2800伤

黎巴嫩传呼机对讲机爆炸 15死2800伤

  9月17日,在黎巴嫩贝鲁特,人们为传呼设备爆炸事件伤者献血。 新华社发   9月17日,在黎巴嫩贝鲁特,人们为传呼设备爆炸事件伤者献血。 新华社发   黎巴嫩多地17日下午发生传呼机爆炸事件,遇难人数至18日已升至12人,其中包括2名儿童和多名卫生部门...

投资1.8亿元,湖北明瑜药业落户安陆洑水

投资1.8亿元,湖北明瑜药业落户安陆洑水

极目新闻记者 陈勇通讯员 刘诗剑 潘定山项目效果图2024年9月18日,湖北明瑜药业项目正式开工建设,该项目总投资1.8亿元,占地46.04亩,落户孝感安陆市洑水镇工业园,主要生产金银花露、米酒、葡萄糖饮品、汽水等产品。该项目落户开工,是洑水镇大力推进招商引...

红星调查|海南三亚“涉恶”企业被“托管”背后

红星调查|海南三亚“涉恶”企业被“托管”背后

▲陈宪清案中被托管的单位之一三亚海韵度假酒店,目前正常经营红星新闻记者|刘木木 发自海南编辑|郭庄责编|官莉三亚旅游文化投资集团有限公司(以下简称“旅文集团”),系三亚市国资委旗下的大型国有企业,目前,该公司被指定对三亚海韵集团有限公司(以下简称“海韵集团”...

A股收评:沪指放量收涨0.69%,近4800只个股上涨

A股收评:沪指放量收涨0.69%,近4800只个股上涨

A股三大指数今日集体上涨,截至收盘,沪指涨0.69%,深成指涨1.19%,创业板指涨0.85%,北证50指数涨1.24%,沪深京三市成交额6294亿元,较上日放量1477亿元。两市近4800只个股上涨。板块题材上,白酒、乳业、食品加工制造等泛消费板块涨幅居前...

再见家乡!你好军营!深圳龙华新兵启程赴军营

再见家乡!你好军营!深圳龙华新兵启程赴军营

“龙华再见,家乡再见!”9月19日上午,深圳北站人头攒动。龙华区入伍新兵身着崭新的迷彩服,肩披红绶带,精神抖擞,斗志昂扬。在龙华区征兵办的组织下,数十名入伍新兵在家乡人民的关注和祝福下,告别熟悉的城市、挚爱的亲友,踏上强军的新征程。站台上,一群身着迷彩服的新...

电影《出入平安》成都路演,阿云嘎唱筷子兄弟成名曲

电影《出入平安》成都路演,阿云嘎唱筷子兄弟成名曲

9月19日,电影《出入平安》校园路演首站来到成都,导演刘江江,演员阿云嘎、娜扎、黄小蕾,编剧黄了了与观众见面,揭秘影片拍摄幕后故事。据悉,《出入平安》将于9月30日正式上映。活动现场导演刘江江透露,他与成都有着很深的缘分,曾在这里获得首届金熊猫奖电影单元最佳...

2024“两个博览会”召开新闻发布会,湖北将作为主宾省精彩亮相

2024“两个博览会”召开新闻发布会,湖北将作为主宾省精彩亮相

极目新闻记者 胡迪凯通讯员 省体宣9月18日,2024中国体育文化博览会、中国体育旅游博览会(以下简称“两个博览会”)展前新闻发布会在苏州市新闻发布厅召开,极目新闻记者了解到,湖北将在“两个博览会”期间作为主宾省精彩亮相,届时还会有巴黎奥运会冠军和湖北体育网...

今天22点30分起,沪杭高铁将采取限速运行措施!杭深、杭台高铁多列停运列车恢复开行

今天22点30分起,沪杭高铁将采取限速运行措施!杭深、杭台高铁多列停运列车恢复开行

受今年第14号台风“普拉桑”外围云系影响,9月19日上午起,上海、浙江沿海多地下起大雨。根据中央气象台台风路径预测,“普拉桑”预计9月19日下午到晚上在浙江象山到上海浦东一带沿海登陆,登陆后携风带雨继续北上,影响或波及长三角多地。中国铁路上海局集团有限公司计...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。