当前位置:首页 > 新闻资讯 > 正文内容

雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏

七夏1周前 (12-30)新闻资讯60

红星资本局12月30日消息,近日,国产大模型DeepSeek在全球爆火,并带火95后AI“天才少女”罗福莉。据悉,罗福莉曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。

AI的风狂吹,小米创始人雷军闻声而动,在DeepSeek-V3发布前几天,其已开出千万元年薪招揽罗福莉,领导小米AI大模型团队。今年11月,小米还成立了专门的AI平台部。

“AI界拼多多”面世

来自量化资管巨头幻方量化

近日,国内AI初创公司DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。在多项基准测试中,V3的成绩超越了主流开源模型,并和世界顶尖的闭源模型不分伯仲。

同时,由于其极低的训练成本,DeepSeek-V3被称为“AI界拼多多”。

据最新发布的技术报告,DeepSeek-V3参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型。此外,其训练成本仅为GPT-4o的二十分之一;售价也低,输入+输出价格约为GPT-4o的十分之一。

DeepSeek在其53页的技术论文中披露:“我们的预训练阶段在不到两个月的时间内完成,成本为2664K GPU小时。结合119K GPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的完整训练成本仅为2.788M GPU小时。假设H800 GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。”

极高的性价比让DeepSeek-V3一经发布便引发国内外惊叹。

公开资料显示,DeepSeek专注于开发先进的大语言模型和相关技术,由国内知名量化资管巨头幻方量化于2023年7月创立,也因此获得资本市场的广泛关注。

95后AI“天才少女”火出圈

北大毕业,曾就职于达摩院

DeepSeek爆红后,DeepSeek-V2的关键开发者之一罗福莉也火出圈,被称为95后AI“天才少女”。


图据“罗福莉”微信公众号

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。

硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

今年5月,在DeepSeek-V2发布以后,罗福莉在知乎上撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。

雷军砸千万招人

小米11月刚成立专门的AI平台部

据报道,在DeepSeek-V3发布前几天,小米创始人雷军已开出千万元年薪招聘罗福莉,领导小米AI大模型团队。

值得注意的是,小米在AI领域早有布局,罗福莉的加入无疑是助力。

2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。

今年11月,小米成立了专门的AI平台部,小米的元老级技术大牛张铎为负责人。张铎本硕毕业于清华计算机系,曾被雷军公开称赞是“小米的大神”,送以“铎神”的称号。

此外,小米近段时间正在搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划已施行数月,由雷军亲自领导。

小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。他预计,自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。

数据显示,小米自2016年组建AI团队以来,经过多次扩展,相关领域人员规模已达3000多人。

编辑 邓凌瑶 综合自证券时报、21世纪经济报道

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/78019.html

分享给朋友:

“雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏” 的相关文章

游客在河南一景区意外身亡?官方回应

游客在河南一景区意外身亡?官方回应

9月16日,河南新乡市辉县市文广旅局就网传“一游客在景区意外身亡”发布情况通报称:9月12日,辉县市公安局接到报警,一名河北省邯郸市人员(程某某,女,70岁)在辉县市失踪,公安机关随后迅速协调组织了多组搜救人员进行大面积排查搜救,于9月13日13时30分许,...

专家认为黎巴嫩寻呼机爆炸事件不太可能由电池过热引起

专家认为黎巴嫩寻呼机爆炸事件不太可能由电池过热引起

黎巴嫩公共卫生部长阿卜亚德18日表示,黎巴嫩多地17日发生的寻呼机爆炸事件造成的死亡人数升至12人。据报道,有外交和安全方面的消息人士推测称,此次寻呼机爆炸可能是由设备的电池过热造成的。但多名专家认为,仅靠电池并不足以引发破坏力如此大的爆炸。纽卡斯尔大学锂离...

民情12345|便民公示牌上的电话都通吗?记者走访:“街长”反问“是哪个给我整的”

民情12345|便民公示牌上的电话都通吗?记者走访:“街长”反问“是哪个给我整的”

便民公示栏是群众与部门间的有效链接,一通电话就能找到人,也能让群众踏实、安心。9月17日,红星新闻报道了成都市个别社区街道的便民公示栏公布的号码,由于更新不及时,出现错漏。(此前报道:民情12345|公示牌上的便民电话,3个全是错的!社区:线下还没及时更新)...

宜昌多云持续,气温波动大!未来三天最高33℃

宜昌多云持续,气温波动大!未来三天最高33℃

今天是2024年9月19日,宜昌天气以多云为主,气温较高,白天最高气温预计32℃,最低气温24℃,微风,空气湿度72%,体感温度31.6℃。市民朋友请注意补水防晒,户外活动请做好防暑降温措施。明日宜昌天气将维持多云状态,气温略有上升,最高气温可达33°C,最...

林剑雄已任东莞市道滘镇党委副书记

林剑雄已任东莞市道滘镇党委副书记

近日,东莞市道滘镇人民政府官网“领导分工”一栏显示,林剑雄已任道滘镇党委副书记。此前,林剑雄担任东莞市城市管理和综合执法局党组成员、四级调研员、市城市管理委员会办公室副主任。林剑雄。图源:东莞市道滘镇人民政府官网公开简历显示,林剑雄出生于1978年10月,2...

国泰航空客机起火,初步调查报告公布!发动机多处有燃烧痕迹

国泰航空客机起火,初步调查报告公布!发动机多处有燃烧痕迹

南都记者从香港特区政府运输及物流局获悉,9月19日,香港民航意外调查机构就日前国泰空客A350-1041型客机发动机起火严重事故,发表调查初步报告。报告显示,涉事客机的一条次级燃油管外部金属编织护套出现破裂,发动机内部发现多处燃烧痕迹,另有多条燃油管存在破裂...

广中医“思政第一课”开讲 党委书记勉励新生传承中医药事业

广中医“思政第一课”开讲 党委书记勉励新生传承中医药事业

南都讯 记者孙小鹏 通讯员廖晓键 黄文珊 “希望同学们赓续百年荣光,强化使命担当,从百年校史中汲取前进的智慧和力量,奋力书写为中国式现代化挺膺担当的青春篇章!”9月19日,广州中医药大学党委书记陈文锋向2024级新生讲授了题为《赓续百年荣光,强化使命担当,在...

全球最贵古代书画《十面灵璧图卷》领衔,15件国宝齐聚广州

全球最贵古代书画《十面灵璧图卷》领衔,15件国宝齐聚广州

9月13日—10月13日,“盛世仰止——宋元明清国宝书画特展”在广州·鹏瑞1号湾颂艺术中心举行,展品包括成交价5.129亿元的全球最贵古代书画《十面灵璧图卷》在内的15件宋元明清国宝传世佳作,总估值近20亿,为广州首次超高规格国宝级古代书画珍藏特展。据悉,开...

沿江两岸华灯璀璨!洪峰过后,南宁这些设施重新亮灯

沿江两岸华灯璀璨!洪峰过后,南宁这些设施重新亮灯

随着郁江2024年第1号洪水洪峰在南宁市安全过境,邕江水位持续回落,邕江两岸环境清理整治和景观恢复也在缓慢得到修复。从轮船通航到邕江沿岸部分绿地亮化设施、跨江桥梁重新亮灯,再到清淤、交通、电力、市容的加快恢复,每一个细节都彰显着这座城市的韧性和活力。璀璨灯火...

“普拉桑”今晚9点45分前后在上海市奉贤区沿海二次登陆

“普拉桑”今晚9点45分前后在上海市奉贤区沿海二次登陆

浙江省人民政府防汛防台抗旱指挥部最新消息:今年第14号台风“普拉桑”(热带风暴级)的中心已于今天(19日)夜间9点45分前后在上海市奉贤区沿海二次登陆,登陆时中心附近最大风力9级(23米/秒),中心最低气压为995百帕。潮新闻记者 施雯(来源:潮新闻)...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。