当前位置:首页 > 新闻资讯 > 正文内容

美股震撼、科技巨头恐慌,95后成群的DeepSeek如何就一夜“破圈”?

▲示意图 似乎就在一夜之间,来自中国的AI公司DeepSeek(深度求索)在大洋彼岸全面“破圈”,从高高在上的美股巨头,到使用AI工具的普通用户都被DeepSeek最新发布的R1模型深深震撼。

当地时间27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。Meta、Open AI等科技巨头员工发帖称,公司内部已开启了“恐慌模式”,紧急制定对策。德国经济学家豪尔格·查皮兹表示,DeepSeek将成为“美国股市的最大威胁”。美国“投资百科”网站称,特朗普才刚刚喊出5000亿美元的“星际之门”计划,就被中国一个仅仅训练了2个月的AI模型打击了信心。

当地时间27日,阿斯麦、英伟达、博通盘前跌超10%,台积电跌超9%。

据报道,DeepSeek创始人梁文锋1985年出生于广东省湛江市吴川市,根据领英等网站公开可查的资料,DeepSeek团队成员约超过一半为95后,90后占比超过75%。梁文锋曾表示,公司员工“都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人”。DeepSeek内部的团队氛围也较为宽松,梁文锋曾表示团队中每一个成员可以调用的资源都“没有上限”,并且管理制度上非常推崇扁平化。

“低成本训练”震撼美国巨头

专家:对美股泡沫冲击大

去年12月26日,DeepSeek发布的V3模型就初露锋芒,以大约Open AI二十分之一的训练成本获得了比肩世界顶级性能的大模型。紧接着在今年1月20日,DeepSeek再度发布R1模型。美国加州的Scale AI公司致力于测评各种AI模型的实际性能,其创始人亚历山大·王在接受采访时表示:“老实说,我觉得DeepSeek在很多项指标上都达到了美国最先进模型的水平”。

除了性能优异,DeepSeek作为一个开源模型,对终端用户始终免费开放,而它对于开发者调用API的收费定价水平几乎为Open AI的百分之一。此前DeepSeek曾公开回应“价格战”的指控,表示在这样的定价之下自己仍有合理的利润结构。低廉的价格来源于该公司在软件算法层面的创新,改变了美国科技巨头们囤积GPU显卡“堆算力”的惯性思维。据悉R1的训练只调用了2000余块显卡,为期53天,总的训练成本仅为558万美元,不到其他世界顶级大模型一次训练成本的十分之一。

这样的极致性价比,让在AI热潮下被炒高了两年的美国科技股感到巨大的“寒意”。豪尔格·查皮兹25日写道:“这家中国公司以极端低廉的成本,在缺少最顶尖芯片供应的情况下打造出一个震动世界的模型,这是对美股泡沫构成的最大威胁。”美国经济学家亚德尼表示,“DeepSeek的成功可能会给美股财报季带来压力,尤其是在谷歌、Meta和微软等公司加大AI资本投入的情况下。尤其是微软,它是OpenAI的最大投资者。”

在DeepSeek热潮的带动下,英伟达股价在当地时间26日下跌3.12%。27日盘前,英伟达股价重挫超10%,带动纳指期货下跌4%。英伟达下一次财报公布预计在2月26日。27日,A股市场迎来春节前最后一个交易日,一些“算力概念股”也因DeepSeek的成功受到影响。不过和DeepSeek公司关联较深的浙江东方、每日互动等个股出现一字涨停。

此外有Meta员工在论坛匿名发帖表示,公司内部针对DeepSeek崛起的威胁感到高度紧张。“毕竟人家模型的训练成本还不如Meta一位高管的年薪,而我们这里有几十位这样的高管,想想这些人怎样才能向上级交差吧。”

创始人梁文锋:

85后“老股民”从量化投资起家


▲梁文锋(右)参加工作座谈会

据湛江发布,DeepSeek创始人梁文锋是吴川市覃巴镇米历岭村人,父母都是小学语文老师。“85后”的梁文锋从小就是“学霸”,在数学方面天赋突出。同学们反映,梁文锋并非“书呆子”类型,而是很有独立思考的精神。梁文锋本科和硕士都就读于浙江大学,2008年,研究生毕业的梁文锋并没有走上“码农”的道路。当时推崇“量化投资之父”西蒙斯的他和朋友一起在出租屋内刻苦钻研,想要找到对股票价格建模的方法。

2010年,沪深股指期货推出,这给了梁文锋充分发挥计算机建模天赋的机会。很快他的自营资金盘就达到了5亿元的水平。2015年,梁文锋与校友一起共同创立幻方量化,在A股市场系统性地进行量化交易。2021年,幻方量化的资产管理规模达到千亿水平,被誉为国内四大顶级量化私募之一。

幻方量化的成功离不开人工智能的深度融合,梁文锋很早就产生了用AI自动制定量化交易策略的想法,并坚持不懈地付诸实践。2020年,英伟达发布了A100芯片,这是英伟达下一代旗舰作品,而幻方量化成为亚太地区第一批拿到货的客户。幻方量化多年来不仅储备了大量的尖端芯片,而且在软件算法层面不断推陈出新,这给梁文锋在AI领域的创业奠定了扎实的基础,2023年7月他创立了DeepSeek(全称“杭州深度求索人工智能基础技术研究有限公司”)。

DeepSeek团队:

90后、95后为主,喜欢“高潜力年轻人”

据报道,DeepSeek的员工规模不到140人,是Open AI的十分之一左右。据领英网站检索样本发现,DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。该公司成员大多毕业于北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。同时DeepSeek的员工中也有相当一部分具有交叉学科背景。


▲幻方量化旗下大模型公司DeepSeek

和动辄上千人的“大厂”AI开发团队相比,DeepSeek百余人的规模显得相当精炼,并且在选人标准上两者也大有不同:互联网公司一般看重成熟的经验,最好有在核心项目成功过的经历,而DeepSeek则喜欢“高潜力年轻人”。以该公司选择的“稀疏训练”技术路径为例,刚毕业的博士生由于在学校里接触过相关前沿课题,对这一技术路径更加熟悉,而“业界老鸟”则不一定对最新技术能保持高度敏感。

据“智能涌现”,一名曾与DeepSeek有过合作的猎头表示,DeepSeek非常偏爱没有工作经验的年轻人,而且指明不要资深人士,“工作经验在3~5年已经是最多的了,工作超8年的基本就pass了”。

梁文锋曾在采访中表示,留住年轻人才的方法主要是“高薪”和“算力管够”两条路。业内人士表示,DeepSeek的薪资水平能够对标业内任何顶尖机构,而且人才如果在字节跳动等取得offer,DeepSeek还会加码竞争。DeepSeek开出的应届工程师薪酬已经等同于业界同等岗位的“总监/经理”的薪酬了。

此外梁文锋非常推崇“极客文化”,在公司内部推行扁平化管理,并且鼓励员工个人发挥潜能进行学习和创新。DeepSeek也不会采用互联网巨头常用的“赛马”机制,减少团队内耗。在算力资源的调配上,梁文锋对每个人都不设上限,只要提出有潜力的思路,他都会给员工调拨足够的资源进行尝试研究。据悉产生R1模型的技术思路就是一名年轻员工“突发奇想”提出的点子,梁文锋为他搭配了一个团队,“花了几个月时间才跑通(技术路线)”。事实证明,DeepSeek这种“轻经验、重潜力”的用人思路,为中国AI界迎来了一次划时代的创新发展。

红星新闻记者 郑直

编辑 杨珒 责编 冯玲玲

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/86285.html

分享给朋友:

“美股震撼、科技巨头恐慌,95后成群的DeepSeek如何就一夜“破圈”?” 的相关文章

一些“网红医生”为何热衷于两性话题?记者调查医疗科普账号违规引流带货乱象

一些“网红医生”为何热衷于两性话题?记者调查医疗科普账号违规引流带货乱象

“昨天夜里,救护车送来一位已经休克的大爷,我们赶紧跑过来给他做了检查,初步判断是××,马上实施抢救。经过4个小时的手术,大爷终于脱离了危险。在这里,我想和大家说,一定要注意身体,身体是本钱。”当你在为这名患者揪心、为医生的医术点赞,顺便为自己的身体做下自查时...

寻呼机爆炸让人细思极恐!全球潜在“爆炸物”数以十亿计,或对航空业影响最大

寻呼机爆炸让人细思极恐!全球潜在“爆炸物”数以十亿计,或对航空业影响最大

在黎巴嫩接连发生寻呼机、对讲机等爆炸事件后,有媒体指出,发生在黎巴嫩的个人设备大规模爆炸事件所波及的远不仅局限于中东地区,更是给全球敲响了警钟。▲爆炸后的寻呼机残片据此前报道,有分析认为发生爆炸的寻呼机在进入黎巴嫩之前就被安装了炸药或某种恶意软件,随即被远程...

张贵超出任茅台酱香酒营销公司董事长

张贵超出任茅台酱香酒营销公司董事长

今(19日)日,有行业媒体消息称,张贵超以贵州茅台酱香酒营销有限公司党委书记、董事长的身份出席“茅台1935文创酒新品上市发布会”。对此,茅台方面今日向记者表示,该消息属实。据2019年11月的公开报道,张贵超当时曾担任贵州茅台酒销售有限公司党委副书记。据悉...

“这是最好的中秋礼物!”用了24年的老电梯换新,居民没花一分钱

“这是最好的中秋礼物!”用了24年的老电梯换新,居民没花一分钱

潮新闻记者 滕一韬 通讯员 蒋成杰杭州上城区清波街道定安苑19、20幢的居民最近有件喜事。这两天,他们用上了崭新明亮的电梯。电梯的交付,意味着老旧电梯更新改造“百日攻坚”行动在定安苑小区率先落地。“这真是最好的中秋礼物!感谢政府的补贴政策,新电梯我们甚至不用...

成都低空经济产业技术创新服务联合体正式成立

成都低空经济产业技术创新服务联合体正式成立

9月19日,2024中国(成都)国际低空经济合作伙伴大会暨2024成都国际低空装备及服务博览会在成都正式开幕。作为大会重要的产业科技创新交流主题活动,“技术筑基 低空展翼”低空经济无人机技术交流会于当天下午举行。活动聚焦新型飞行器制造、无人航空运营、低空安全...

聚焦AI前沿,102家科技公司亮相,这场科技盛会在成都开幕

聚焦AI前沿,102家科技公司亮相,这场科技盛会在成都开幕

9月19日,主题为“创新中国 AI纪元”的第18届DEMO CHINA在成都开幕,为期两天。活动现场,102家早期科技公司参与超级展示、企业对接等环节,在科技与投资的盛宴中分享成都AI产业机遇。据了解,DEMO CHINA在2006年由全球领先的科技公司ID...

公益集市升级!社区恵邻工会小组为居民送服务

公益集市升级!社区恵邻工会小组为居民送服务

极目新闻记者 李庆通讯员 王碧霞“快快快,公益集市开始了,我刚把刀磨了一下,还测了一下高血压。”“集市居然还有法律咨询,我刚好有法律问题要律师答疑解惑。”近日,武汉市武昌区南湖街道宝安社区恵邻工会小组在阳光花园惠邻议事厅开展公益集市,居民们纷纷相约来打卡,对...

《山花烂漫时》正鲜活绽放:被细节具象化的张桂梅

《山花烂漫时》正鲜活绽放:被细节具象化的张桂梅

极目新闻记者 张聪“希望不是别人给的,是靠自己争取来的。”这是正在CCTV-1黄金档、腾讯视频播出的剧集《山花烂漫时》剧中,“张桂梅”把14岁的女学生“谷雨”从家里“抢出来”时鼓励她的话,也是剧中张桂梅一路建立华坪女高的精神写照。9月10日,由费振翔执导、宋...

海浪蓝色警报:渤海黄海将出现2.5到4米的大浪到巨浪区

海浪蓝色警报:渤海黄海将出现2.5到4米的大浪到巨浪区

国家海洋预报台9月20日8时发布海浪蓝色警报:受较强冷空气的影响,预计9月20日中午到21日中午,渤海、黄海将出现2.5到4米的大浪到巨浪区;河北、天津、山东、辽宁西部、江苏北部近岸海域将出现2到3.4米的中浪到大浪,近岸海域海浪预警级别为蓝色。请在上述海域...

真实案例披露!国家安全机关收集证据不得拒绝

真实案例披露!国家安全机关收集证据不得拒绝

国家安全,事关你我,维护国家安全是每个公民应尽的义务。国家安全机关在依法执行公务时,需要广大人民群众的支持、协助。人民群众在配合国家安全机关工作时,应依法如实、主动地提供有关情况,共筑维护国家安全的钢铁长城。配合询问利人利己小刘是某网红餐厅客户经理,老赵则是...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。