突然崩了!大量人涌入!网友:国产崛起,美国慌了
太火爆!
国产AI大模型震惊全世界
大量网友涌入
服务器都宕机了
这两天
“DeepSeek崛起”相关话题
持续霸榜热搜
近日,国产AI DeepSeek
在中国、美国的科技圈
受到广泛关注
甚至被认为是
大模型行业的最大“黑马”
DeepSeek登顶App下载排行榜
大量网友涌入,服务短暂“崩了”
这款由 国产大模型公司杭州深度求索开发的DeepSeek 应用27日登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。
26日,DeepSeek曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。
27日有消息称DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。
对于 DeepSeek 如何看待“两天两崩”,DeepSeek 回复称,技术服务的稳定性受多重因素影响,可能涉及突发流量、系统升级适配或底层基础设施的临时波动等。我们的团队始终将稳定性作为首要任务,并会在每次事件后彻底分析原因,持续优化系统韧性。
DeepSeek究竟厉害在哪里?中国工程院院士、清华大学计算机系教授郑纬民及多位AI圈人士在与新浪科技沟通中,指出了DeepSeek其成功出圈的关键所在。
在郑纬民看来,DeepSeek通过自研的MLA架构和DeepSeek MOE架构,为其自身的模型训练成本下降,起到了关键作用。他指出,“MLA主要通过改造注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,打造了目前公开最大的稀疏MoE 层,这成为DeepSeek训练成本低最关键的原因。”
震惊业界!
AI大佬惊叹:中国AI已追上美国
1月20日,杭州深度求索人工智能基础技术研究有限公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。 作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。
多位知名科技人士均对DeepSeek近期取得的成就表示赞叹。
AI科技初创公司Scale AI的创始人亚历山大·王(Alexandr Wang)称,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
绕开美国限制
完全颠覆了行业逻辑
DeepSeek完全颠覆了行业的逻辑!有消息称,他只用了2000张阉割版的英伟达H800芯片和六百万美元就做到了这一切,达到甚至超过openAI的水准!
更重要的是,这一成就是在美国对华芯片出口管制加强的背景下实现的。
DeepSeek直接打破无脑堆砌算力、数据的美国式AI道路! DeepSeek团队取得的成就,相当于做芯片的用自己逆天般的开发能力,直接把摩尔定律干翻了!
而且开发团队,直接“开源”,50多页的论文各种底层架构微创新,写得清清楚楚,还公开了所有参数和代码,随便你分析随便你复制随便你验证。
著名投资公司A16z的创始人马克·安德森1月24日发文称,DeepSeek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。
1月24日,A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”
对于中国AI为何能有如此快速的进展,诺奖得主、“AI教父”杰弗里·辛顿在1月21日接受博主Curt Jaimungal专访中表示,中国的STEM(科学、技术、工程、数学)教育比美国更好,拥有更多受过良好教育的人才,这将为AI的发展提供坚实的基础。尽管美国试图通过限制(如英伟达芯片)来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。
Meta进入恐慌模式
试图复制DeepSeek
1月24日,一条发布在匿名平台teamblind上的帖子疯传。一名Meta(原名Facebook,美国互联网科技公司)员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。
这位Meta员工写道:
“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。
工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。
管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?
DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”
DeepSeek或彻底改变游戏规则
英伟达股价大跌
斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。
但DeepSeek完全不同,它的训练成本并不昂贵。Noah's Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。
特别是在特朗普上任后开启的5000亿美元“星际之门”计划,DeepSeek更让人怀疑,巨额投入这种“大力出奇迹”的办法真是最有效的方法吗?
美股大V“THE SHORT BEAR”1月24日在X上发文称,DeepSeek给AI巨头们带来了痛苦时刻,投资者必须对此敲响警钟。
他说:“如果击败OpenAI只需要5500万美元,那么这个行业的商业化会比很多人预想的要快很多。”
他还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。现在看来,这种冒险行为变得越来越无利可图。”
著名财经记者Holger Zschaepitz 1月25日表示,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们质疑该行业数千亿美元资本支出的效用。
有投资者甚至认为,美股芯片股的股价也会面临挑战。
投资者Geiger Capital表示,Deepseek和OpenAI一样好,甚至更好,而且价格只有后者的3%,而美国公司却投入了数千亿美元。那么,纳斯达克会怎样呢?
当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。
因受到DeepSeek人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。
支持更多新闻 期待更多点赞
互联网新闻信息服务许可证编号:23120170003
来源 丨 杭州日报、第一财经、每日经济新闻、九派新闻、财联社、界面新闻、中国新闻社
编辑丨 李楠
责编丨 郭启迪
审核丨 刘鹏
扫描二维码推送至手机访问。
版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。