当前位置:首页 > 新闻资讯 > 正文内容

DeepSeek站在巨人肩上,这个巨人到底是什么?


春节期间,中国国产大模型DeepSeek持续引发热议,意外地成为假期最热门的科技话题。

1月20日,中国大模型公司深度求索正式发布推理大模型DeepSeek-R1,一经推出就震撼了业界。1月27日,DeepSeek应用登顶苹果中国区和美国区应用商店免费App下载排行榜。1月31日,英伟达、亚马逊和微软这三家美国科技巨头,在同一天宣布接入DeepSeek-R1。

DeepSeek的成功,是AI的一次破圈。这一次DeepSeek引发的讨论特别热烈,一方面是因为它达到了国际先进水平;另一方面,是因为它的可用程度、完成度超过了一定的水平,再加上热烈的讨论,引起了很多普通人的注意,也进入了他们的生活和工作之中。

DeepSeek体现了国产大模型的能力,甚至有可能追赶、反超世界先进水平。与此同时,DeepSeek大幅降低了AI模型的训练成本,其R1模型的训练成本仅为557.6万美元。相比之下,OpenAI的GPT模型训练成本高达1亿美元。

很多人对DeepSeek大模型表达了高度赞赏。面对如潮好评,深度求索(DeepSeek)创始人梁文锋谦虚地回应:“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”

梁文锋所说的这个“巨人”——开源社区(Open Source),全称为开放源代码,就是让用户利用源代码,在其基础上修改和学习。

开源,有世界大同的美好愿望,但毋庸讳言也有利益动机。开源策略可以吸引全球开发者和研究者的关注,形成一个强大的技术社区。这个技术社区具有敏捷性与协作优势,能形成“技术共享-生态繁荣-反哺创新”的正循环。正因为开源有这个优势,在竞争中处于弱势的一方就可能选择开源的方式,去扭转自己的竞争弱势。计算机行业的竞争,往往都是一个封闭的生态,对应着一个开放的、开源的生态。

开源如今已经是AI迅猛发展的助推剂。Meta首席人工智能科学家、2018年图灵奖得主杨立昆评价DeepSeek时就说:“与其说是中国在人工智能上超越美国,正确的看法应该是开源代码正在超越私有模式。DeepSeek从开放研究和开放源码中受益(例如来自Meta的PyTorch和LLaMA)。”

实际上,AI大模型开源,最重要的推动力之一正是Meta。Meta开源的项目,从大模型LLaMA到图像分割模型Segment-Anything,覆盖了各种模态、各种场景。Meta的LLaMA是最强大的开源大模型之一。2023年7月,Meta发布的LLaMA2,开源协议从“仅研究可用”转向“免费可商用”,虽造就了一大批“套壳大模型”,但也帮助Meta改变了大模型竞争OpenAl独占鳌头的格局。这当中,最强大的正是DeepSeek。

DeepSeek验证开源模型可接近闭源性能,又会反过来使得Meta等巨头加码开源AI。最近,Meta又开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力。

虽然开源促进了AI的迅猛发展,但应该看到的是,开源的本质是用开放促效率,而在当今世界,效率在很多时候已经不再是第一位的考虑。AI技术是由软硬两方面构成的,在硬件逐渐走向封闭的同时,一个可能的隐忧则是,软件的开源是否也会走向封闭。这就要求中国AI界提前做好应对之策,用创新、开放去回应封闭,正如DeepSeek也开源了自己的大模型。 □ 刘远举

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/87012.html

分享给朋友:

“DeepSeek站在巨人肩上,这个巨人到底是什么?” 的相关文章

刀郎家乡资中一广场改名“山歌响起的地方”,知情人:充分听取歌迷意见

刀郎家乡资中一广场改名“山歌响起的地方”,知情人:充分听取歌迷意见

沉寂十年后,刀郎复出,线上演唱会“爆火”网络。随后,刀郎宣布开启个人2024年巡回演唱会,首站成都的演唱会将于9月21日、22日开唱,接连两晚两场。 刀郎的家乡四川资中县,也因他的复出爆火而“出圈”,不少歌迷和网友开始关注了解这座千年古城。9月18日,红星新...

官方通报:三只羊,立案调查

官方通报:三只羊,立案调查

9月17日,合肥高新区市场监督管理局发布情况通报称,近日,三只羊网络科技有限公司直播带货的“香港美诚月饼”引发关注。对三只羊网络科技有限公司在直播中涉嫌“误导消费者”等行为,现已立案调查,将根据调查结果依法依规处理。直播间卖的“香港美诚月饼”,在香港根本买不...

武汉市江岸区“全国科普日”启幕,育才华岭小学科普热潮涌动

武汉市江岸区“全国科普日”启幕,育才华岭小学科普热潮涌动

极目新闻记者 国倩通讯员 张旭英“提升全民科学素质,协力建设科技强国”,为贯彻落实全国“科技三会”精神,大力弘扬科学精神和科学家精神,进一步激发青少年的科技热情和创新创造活力,近日,武汉市江岸区“全国科普日”活动启动仪式在武汉市育才华岭小学开幕。活动伊始,由...

上海黄河路将打造“繁花街区”,还有更多知名小马路也要更新

上海黄河路将打造“繁花街区”,还有更多知名小马路也要更新

黄河路、汉口路、山东中路、淡水路,都是上海市中心的知名小马路。记者9月18日从上海黄浦区举行的“一街一路”精细化治理项目沟通会上获悉,黄浦区今年将对黄河路、汉口路和山东中路、淡水路等启动更新改造。在改造中,黄浦区始终贯穿“全过程人民民主”,把群众普遍关切的、...

贷款交社保?广西大化农商行推出续保贷,工作人员:已暂停

贷款交社保?广西大化农商行推出续保贷,工作人员:已暂停

近日,网传广西多家农商行推出“续保贷”,帮助社保缴纳困难人群缴纳社保,并允许贷款人退休后用养老金来偿还贷款。 来源:大化观点就“续保贷”,南都·湾财社记者致电网传图片所涉广西大化农商行,工作人员称该产品目前已经暂停,对于申请条件,该工作人员称“不清楚相关情况...

买棋卖棋操纵比赛,“中国象棋第一人”王天一被终身禁赛,撤销所有技术等级称号

买棋卖棋操纵比赛,“中国象棋第一人”王天一被终身禁赛,撤销所有技术等级称号

9月19日上午,中国象棋协会发布关于对王天一、王跃飞等运动员违规行为进行处罚的情况通报:终身禁赛王天一、王跃飞,撤销所有技术等级称号。中国象棋协会发布的情况通报通报称,2023年4月,象棋“录音门”事件,引起社会关注。中国象棋协会对此高度重视,会同有关方面开...

“摩羯”“贝碧嘉”刚走,“普拉桑”“苏力”“西马仑”排队又来了,台风增多或与全球变暖有关

“摩羯”“贝碧嘉”刚走,“普拉桑”“苏力”“西马仑”排队又来了,台风增多或与全球变暖有关

据中央气象台消息,今年第13号台风“贝碧嘉”减弱后的热带低压强度进一步减弱,目前已很难确定其环流中心,中央气象台18日23时对其停止编号。不过,“摩羯”“贝碧嘉”刚走, 14号台风“普拉桑”、 15号台风“苏力”、 16号台风“西马仑”又排队来了……(图源:...

今日起“飞”!2024中国(成都)国际低空经济合作伙伴大会开幕

今日起“飞”!2024中国(成都)国际低空经济合作伙伴大会开幕

沉浸式体验重返地球、登陆月球、海洋探险等飞行游戏,与飞行汽车、全球首款无人驾驶电动垂直起降(eVTOL)航空器等亲密互动……9月19日,2024中国(成都)国际低空经济合作伙伴大会暨2024成都国际低空装备及服务博览会在蓉开幕。本次展会面积12000平方米,...

评论丨高校领导试住学生宿舍,让住宿问题从“边缘”走向“中心”

评论丨高校领导试住学生宿舍,让住宿问题从“边缘”走向“中心”

这也不失为大学教育应有的一课:大学是一个人文化的空间,应当有从个人体验本身出发的管理思路和行事逻辑新学期开始前,浙江工商大学全体领导班子成员入住维修提升后的教工路校区学生宿舍一周,通过“试住”体验大学生的吃、住、行等生活环境,全面检查校区准备情况。此事经媒体...

主打一个配合默契,民警“教科书”式救下轻生男子

主打一个配合默契,民警“教科书”式救下轻生男子

现代快报讯(通讯员段羽铭 记者葛小林)近日,常州一男子爬上楼顶意图轻生,两名民警默契配合,成功地拯救了这名男子,完成了一次“教科书式救援”。△男子爬上楼顶想要轻生警方供图现代快报记者从常州钟楼警方了解到,近日,钟楼公安分局五星派出所接到指令称,辖区有一男子在...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。