当前位置:首页 > 新闻资讯 > 正文内容

DeepSeek登顶下载榜:冯骥、朱啸虎力荐AI界拼多多

就在刚过去的周末,国产AI大模型DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一,引发硅谷关注。 在国内各大社交媒体上,DeepSeek更是引起了广泛讨论,“中国AI大模型震动华尔街”“全球掀DeepSeek复现狂潮”“DeepSeek登顶美区苹果下载榜”等等话题迅速冲上热门。另外,《黑神话:悟空》制作人冯骥、金沙江创投朱啸虎也纷纷下场推荐DeepSeek。

对标OpenAI o1,用更少的卡训练出效果差不多的模型

就在1月20日,DeepSeek刚发布了性能对标OpenAI o1 正式版的R1大模型,并同步开源模型权重。据悉,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

值得一提的是,在模型训练费用昂贵的当下,DeepSeek仅仅花费了560万美元训练R1模型,但该模型在很多AI基准测试中已经达到甚至超越OpenAI o1模型。另外,不少开发者尝试复现 DeepSeek-R1。比如,伯克利 AI 研究所在读博士潘家怡(Jiayi Pan)就遵照 DeepSeek R1-Zero的算法复现,结果只用了不到30美元的计算成本,就让其项目中的模型拥有了自我验证和探索的能力。

牛津大学博士、百度前高级科学家吴俊德在社交媒体上表示,DeepSeek在海外已被吹上天了,其认为行业贡献而言:GPT>deepseek>gemini>llama及其他。谈及DeepSeek引起关注的原因,吴俊德表示,“很多人的着眼点在于DeepSeek用很少的卡也能训练出效果差不多的模型,但这是结果,更重要的是DeepSeek这次证明了纯粹的outcome reward Rl能够直接把模型提到o1水平,在他出来之前,业内所有人都认为需要prm(process reward model)才能做到这点,这已经是颠覆行业的发现。”

吴俊德还提到,这意味着,“用更少的卡训练出效果差不多的模型”可能不仅仅是节约成本这么简单,更是一种新的进化方式,意味着在这种方法往上堆更多的卡有可能把模型能力再往上提升一个数量级,甚至直接达到AGI(通用人工智能)。

《黑神话:悟空》制作人:“可能是个国运级别的科技成果”

1月26日晚,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥也发了一篇长微博推荐DeepSeek。他表示,DeepSeek V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。“先讲一句暴论:DeepSeek可能是个国运级别的科技成果”。

冯骥打了个比方说,如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破。“一是强大到比肩O1的推理能力,暂时没有之一;二是便宜,参数少,训练开销与使用费用小了一个数量级;三是开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;四是免费,目前提供的服务完全免费,任何人随时随地可用;五是联网,暂时唯一支持联网搜索的推理模型(o1还不支持);六是本土,深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。”



金沙江创业投资基金主管合伙人朱啸虎也在社交媒体上表示,“DeepSeek登顶美区App Store,是技术理想主义者的胜利,最难的是最简单的。专注于技术和创新,远胜投放买流量和PR;二是行业技术迭代周期远快于资本支出的回报周期,前期的重资本投入还未取得充分回报,就已经过时,需要加速折旧摊销,整个LLM行业都需要重塑估值体系;另外给民营经济生长的缝隙,不需要政府投入,回报远超产业政策的扶持。”



公开资料显示,DeepSeek是幻方量化旗下的AI公司,创立于2023年,幻方量化创始人梁文峰在量化投资和高性能计算领域有深厚背景,毕业于浙江大学电子工程系人工智能方向的。DeepSeek一直走开源、性价比路线,一直被冠以“AI界拼多多”的名号,至今还没融过资。

去年5月,DeepSeek发布DeepSeek-V2,价格是GPT-4-Turbo的近百分之一,“AI界拼多多”瞬间声名鹊起。去年12月,DeepSeek还发布了大模型DeepSeek-V3,因该模型“2048个GPU、2个月、近600万美元”的极低训练预算受到关注。

采写:南都记者 林文琪

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/86212.html

分享给朋友:

“DeepSeek登顶下载榜:冯骥、朱啸虎力荐AI界拼多多” 的相关文章

肥东4.7级地震|安徽省地震局召开新闻发布会 回应社会关切问题

肥东4.7级地震|安徽省地震局召开新闻发布会 回应社会关切问题

大皖新闻讯9月18日,据中国地震台网正式测定,2024年9月18日20时08分,在安徽合肥肥东县(北纬31.98度,东经117.6度)发生4.7级地震,震源深度12公里。当晚10:30,安徽省地震局,安徽省应急管理厅联合召开“肥东4.7级地震新闻发布会”。安...

一个月内开展复工!南都报道后,佛山这条桥烂尾桥有新进展

一个月内开展复工!南都报道后,佛山这条桥烂尾桥有新进展

近日,南都记者多次走访佛山市南海区水口水道大桥,对市民反映的桥面通车近4年,但桥的一侧辅道仍在待施工状态,路面时有发生交通事故,设置了2.2米限高龙门架,导致公交车也无法通行等问题进行实地调查。9月10日,依据实地调查情况,南都发布高质量发展微观察系列报道之...

8岁女孩被批评后离家出走误入高速路:为防定位将电话手表藏家中,幸被警方救助

8岁女孩被批评后离家出走误入高速路:为防定位将电话手表藏家中,幸被警方救助

“如果不是你们,我们不知道要找到什么时候,太感谢你们了。”从民警手中接回8岁女儿,家长对民警连声道谢。 9月19日,红星新闻记者从四川高速公安三分局二大队获悉,两天前,这名8岁女孩被妈妈批评了几句后,竟将电话手表藏在家里并离家出走,准备去数十公里外的姑姑家。...

“空中ICU”来了!救援组合亮相成都国际低空经济合作伙伴大会

“空中ICU”来了!救援组合亮相成都国际低空经济合作伙伴大会

9月19日,2024中国(成都)国际低空经济合作伙伴大会暨2024成都国际低空装备及服务博览会在成都开幕。在中国西部国际博览城9号馆外广场上,一架标有“成都消防”字样的军绿色直升飞机格外显眼。在距离直升飞机不远处,还停放着一辆红色的航空救援一体指挥车。这款救...

台风“苏力”生成 未来三天北部湾海面风雨强,广西局地有暴雨到大暴雨!

台风“苏力”生成 未来三天北部湾海面风雨强,广西局地有暴雨到大暴雨!

天气实况与预报天气情况9月19日天气:19日白天,崇左、南宁、贵港、玉林、防城港、钦州、北海等市多云有阵雨或雷雨、局地大雨到暴雨并伴有短时雷暴大风等强对流天气,其它地区多云有分散阵雨或雷雨。沿海地区有5~6级、阵风7~8级偏北风。台风“苏力”消息:热带低压已...

微信朋友圈可以发实况照片了!照片将包含动态画面和声音

微信朋友圈可以发实况照片了!照片将包含动态画面和声音

9月19日,据微信派消息:嚯,微信朋友圈可以发实况照片了!打开朋友圈-从手机相册选择,即可选中并发布实况照片,照片将包含动态画面和声音。发布时,也可以点击关闭实况效果,支持静态照片与实况照片混合发布。演示步骤截屏发布后,朋友圈图片将出现实况圈圈效果,主打一个...

注意!9月21日至22日昆明这些区域禁飞无人机

注意!9月21日至22日昆明这些区域禁飞无人机

为确保2024昆明半程马拉松暨昆明玉溪双城马拉松(昆明站)在昆举办期间公共安全和低空安全昆明市公安局发布《关于加强“低慢小”航空器管理工作的通告》(来源:昆明市公安局新闻宣传办公室)...

台风“普拉桑”登陆,江苏风雨强度将进一步增强

台风“普拉桑”登陆,江苏风雨强度将进一步增强

今年第14号台风“普拉桑”(强热带风暴级)的中心已于9月19日傍晚6点50分前后在浙江省舟山市岱山县沿海登陆,登陆时中心附近最大风力10级(25米/秒),中心最低气压为990百帕。受其影响,预计9月20日苏南和江淮之间东部地区雨量中到大雨,部分地区暴雨;20...

持续加强水资源管理 新疆今年已累计供水531.22亿立方米

持续加强水资源管理 新疆今年已累计供水531.22亿立方米

天山网-新疆日报讯(记者康颢严报道)记者从自治区水利厅获悉:新疆持续完善水资源集中统一领导机制,加强水资源统筹调配和开发利用,截至9月10日,全疆累计供水531.22亿立方米,较上年同期多供10.03亿立方米,累计灌溉面积7.05亿亩次,较上年同期多灌185...

刑事惩戒失信行为,护航诚信营商环境

刑事惩戒失信行为,护航诚信营商环境

极目新闻记者 孙婷婷通讯员 常亮 向玲近日,武汉市江夏区人民法院刑事审判庭审结一起拒不支付劳动报酬罪案件,涉案当事人丁某被依法判处有期徒刑一年七个月,并处罚金。2022年12月,丁某成立了一家经营销售农产品的公司,公司运营期间,雇用汪某某、严某某等60余名工...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。