当前位置:首页 > 新闻资讯 > 正文内容

零一万物缩减算法团队?李开复:AI六小虎都够钱做预训练

七夏4个月前 (10-16)新闻资讯170

继发布千亿参数模型Yi-Large之后,时隔五个月,零一万物于10月16日正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o。这意味着仅花费五个月零一万物已追上OpenAI的顶级模型。 就在近期,有媒体报道称,被称为“AI六小虎”的6家中国大模型初创企业月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰,其中有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。 发布会后,零一万物创始人李开复针对这一问题直接回应称,预训练既是技术活也是费钱的事儿,但据他了解,目前“AI六小虎”做预训练仍不成问题。“这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的6家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”

最新模型击败GPT-4o,行业往OpenAI o1方向狂奔

10月16日,继上半年千亿参数模型Yi-Large之后,零一万物正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o-2024-05-13、Claude 3.5Sonnet,排名世界第六,中国第一。这也是在LMSYS这一全球大模型必争的公开擂台上,中国大模型首度实现“超越OpenAI GPT-4o ”。



翻译是模型落地的典型场景,考验的是模型的语言理解和生成、跨语言能力与上下文感知能力。在这一典型场景的测评中,Yi-Lightning更快速地将莎士比亚的《李尔王》中的经典语句准确翻译出来,将“unaccommodateed man”翻译成没有外物装饰的人,相较之下阿里云旗下的Qwen2.5-72b-Instruct翻译成了“未受文明熏陶的人”、字节Doubao-pro 翻译成了“毫不遮掩的人”,DeepSeek-V2.5翻译成了“没有装饰的人”。



同时,较上一代旗舰模型 Yi-Large ,Yi-Lightning 的最高生成速度提速近四成,在与 GPT-4o的对比中,Yi-Lightning 的生成速度堪称“极速”。

谈及如何快速赶上国际顶级模型GPT-4o的进度时,李开复表示,其实缩短时间差非常困难。“我不预测我们(未来)可以(继续)缩短这个时间差,毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们时间差能达到只是因为我们模型、AI infra等团队都努力去使用和理解对方做出来的东西,再加上我们自己每家的研发有特色,比如数据处理、训推优化等,现在这一套方法论在零一万物已经成熟了。”

另外,南都记者关注到,零一万物花费近5个月赶上了GPT-4o的进度,同时OpenAI也在9月发布了其被业界称为是AGI(通用人工智能)一大进程的OpenAI o1系列模型。李开复透露,OpenAI内部其实攒了很多好东西,除了OpenAI o1以外,OpenAI领先行业足够多,但会等待合适的节点再释放。而OpenAI o1把只在预训练中scaling的趋势扩展到了推理的时候,让行业认知到训练SFT和强化训练都非常重要,目前中美有不少公司都在往o1的方向狂奔。

加入“价格战”,百万token降至九毛九仍有利润

除了C端以外,此次发布会上李开复还公布了零一万物在B端产品上的最新进展。李开复称,零一万物最新旗舰模型 Yi-Lightning 的 API 价格已降至极低水平,每百万 token 仅收费 0.99 元。

发布会上,针对此次大模型价格降价李开复不断强调称,有人或许会质疑零一万物是否在亏钱拉客户,但自己可以自信地回应,零一万物大模型的真实成本比比0.99元低。“不用担心我们被用垮了,欢迎大家使用,还是有利润空间的。”

今年5月,字节、百度、阿里云、腾讯、讯飞等大模型厂商纷纷大降价格,掀起了一场价格战。当时大模型初创企业零一万物CEO李开复做大模型系统发布时曾表示,其认为大模型之间搞类似于ofo的流血打法是双输的策略。“我觉得大模型公司不会这么不理智,因为技术还是最重要的,当大模型厂商的团队认定自己的技术值得的时候,就会坚持一个合适的价格,而绝不会只靠贴钱、赔钱去做生意。”

发布会上谈及前段时间的“价格战”,李开复也表示,当时有很多性能很差的模型价格都降得非常低,甚至是免费,但让接入的企业和个人体验起来都不达预期,这样的“价格战”李开复并不认同。

李开复强调,在个人或者企业接入API时,足够好的模型性能很重要,否则产品无法达到PMF(产品与市场的匹配度);同时如果一个模型性能很高,价格却很白菜,用户每天调用十几次,累积下来的成本也不可忽视。而零一万物在这两个因素之间已经找到了一个合适的价格。“我们也知道要控制成本,不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。欢迎大家试用,一定物超所值。”

辟谣放弃预训练,李开复称“AI六小虎”都做得起预训练

10月3日,OpenAI官宣称自己已成功获得66亿美元(约合人民币466.9亿元)融资,估值突破了1500亿美元。不过,随后有媒体报道称,通过对OpenAI的财务数据分析推测,OpenAI将于2029年实现盈利,但在此之前OpenAI依然会存在较为严重的亏损,预测2026年亏损幅度将达到140亿美元(约合人民币990.5亿元)。

尽管技术领先足够多,但就连OpenAI都仍未实现较好财务状况,国内的大模型创业公司情况会更好吗?就在近期,有媒体报道称,被称为“AI六小虎”的6家中国大模型初创企业中(月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰),已经有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。

对此,近期李开复曾在朋友圈辟谣称,“零一万物一直在做预训练,去年和今年发布的Yi-34B, Yi-Large, Yi-Coder, Yi-VL Yi-Vision都是发布时全球第一梯队国内领先的预训练模型。同时零一万物新的预训练模型也即将推出,也会是全球第一梯队,届时谣言将不攻自破,建议自媒体可以先删稿。”

发布会后李开复再次分享称,预训练既是技术活也是费钱的事儿。“做好预训练模型是一个技术活,需要非常多有才华的人一起工作,慢工出细活。需要懂芯片的人、懂推理的人,也需要懂基础架构的人、懂模型的人、很好的算法同学。如果一个公司能有幸拥有这么多优秀的人才跨领域合作,我相信中国是绝对可以做出世界排名前十的预训练的通用模型。不过,因为成本比较高,也不是每家公司都可以做这件事情,以后做预训练的大模型公司可能越来越少。”

不过,李开复强调,目前“AI六小虎”做预训练仍不成问题。“据我所知,这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”

发布B端数字人、全行业解决方案

此次发布会上,零一万物还推出了AI 2.0数字人解决方案、全行业解决方案、AI Infra等产品及服务,面向B/G端客户构建起了从定制模型到专有应用搭建的一整套解决方案。

南都记者了解获悉,零一万物的行业应用产品AI 2.0数字人聚焦零售和电商等场景,将新发布模型Yi Lightning实践于具体行业解决方案。基于以Yi Lightning模型为代表的Yi模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,形成了与AI 1.0时代完全不同的数字人解决方案。



其中,角色大模型为零一万物AI 2.0数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过多国语言和情感表达的门槛,另外电商话术大模型也能成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。Yi-Lightning模型接入后,零一万物AI 2.0数字人对弹幕意图的识别更加精准、生成话术更自然、能够一步到位完成促单。

目前,零一万物的AI 2.0数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入Yi-Lightning全新加持的数字人直播后,GMV较此前上升170%。

另外,此次发布会上李开复还提到,在当前的市场需求下,仅仅为企业客户提供标准化模型还远远不够。李开复分享称,审视各垂直行业的核心业务流程就会发现,尽管基座模型具备一定的能力,但其在帮助核心业务提效方面仍显不足。这一现状制约了模型在客户核心业务场景中的深度融合,也限制了大模型的商业价值。因此基于企业不同的业务场景,零一万物也发布了全行业解决方案,除基座模型外还会搭配有RAG、Function Calling等一系列实用性经过检验的工具 。

采写:南都记者 林文琪

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/28887.html

分享给朋友:

“零一万物缩减算法团队?李开复:AI六小虎都够钱做预训练” 的相关文章

“一针治癌”?让公众认清“神医”的真面目

“一针治癌”?让公众认清“神医”的真面目

“念数治万病”“一针治癌”“花199元听网课后可月赚7万元”……据近日澎湃新闻报道,一些知识店铺售卖的线上线下中医培训课程,并非真的讲授中医知识,而是打着中医的幌子卖课圈钱。有的直播间里自称“神医传人”“国医名师”的讲师,实际上没有中医培训资质,“神医”背后...

爆冷!奥运冠军被淘汰

爆冷!奥运冠军被淘汰

9月18日,在江苏常州进行的世界羽联巡回赛中国公开赛男单比赛中,中国选手雷兰曦2:1力克巴黎奥运会男单冠军安赛龙晋级16强,爆出了本届中国公开赛最大冷门。安赛龙作为东京奥运会、巴黎奥运会两届男单冠军,虽然奥运会后的参赛频率不高,但目前他的世界排名仍然高居世界...

周星驰发文悼念!石班瑜最后一条朋友圈,泪目了

周星驰发文悼念!石班瑜最后一条朋友圈,泪目了

9月17日上午,有“周星驰御用配音”之称的配音演员石班瑜在北京去世,享年66岁。石班瑜的家属在网上发布讣文。得知消息后,周星驰第一时间发文表示哀悼:永远怀念石班瑜先生。图片来自微博曾与石班瑜共事多年的配音演员叶清发布微博悼念老友,并转贴了石班瑜最后的朋友圈。...

深圳一女子发58页PPT举报管培生男友多次嫖娼出轨,银行回应

深圳一女子发58页PPT举报管培生男友多次嫖娼出轨,银行回应

9月18日,广东省深圳市一女子制作58页PPT爆料其男友招商银行管培生史某某,与多名女性约炮、嫖娼、出轨。内容显示其与史某某于2023年10月确立恋爱关系。PPT从5个方面列举史某某的约炮、嫖娼等证明,列举了10次嫖娼记录。其中8月25日打网约车到深业有居金...

中国消费者报:“三只羊”对商品产地玩文字游戏也是消费欺诈

中国消费者报:“三只羊”对商品产地玩文字游戏也是消费欺诈

近日,“三只羊”网红主播“疯狂小杨哥”在直播间宣传售卖的“香港美诚月饼”引发大量争议。“疯狂小杨哥”在直播间宣传售卖的“香港高端月饼”被曝在香港没有线下售卖点,且产地并非香港,其虽在香港注册了相关商标,但在香港无实体门店,实际运营方为广州公司。9月17日,合...

首次公开亮相!408件(套)南海沉船出水文物将展出

首次公开亮相!408件(套)南海沉船出水文物将展出

“深蓝宝藏——南海西北陆坡一二号沉船考古成果特展”新闻发布会今天(9月19日)下午在海口举办。本次展览是南海海域深海考古调查的成果专题展,也是国内首展,将于9月27日下午在中国(海南)南海博物馆正式开幕。届时,沉睡在深海1500多米、历经400多年的出水文物...

调侃“九一八”的网红娟子被抓?警方:此事正在调查

调侃“九一八”的网红娟子被抓?警方:此事正在调查

极目新闻记者 唐佳燕9月19日,有网友发布视频反映,前一天在直播中调侃“九一八”的江苏盐城网红“娟子爱吃”(简称娟子),被民警带到医院体检,疑似被抓。网友拍下的疑似娟子被抓场景 (视频截图)19日下午,极目新闻记者联系发布视频的网友,未获回应。盐城市公安局办...

刑事惩戒失信行为,护航诚信营商环境

刑事惩戒失信行为,护航诚信营商环境

极目新闻记者 孙婷婷通讯员 常亮 向玲近日,武汉市江夏区人民法院刑事审判庭审结一起拒不支付劳动报酬罪案件,涉案当事人丁某被依法判处有期徒刑一年七个月,并处罚金。2022年12月,丁某成立了一家经营销售农产品的公司,公司运营期间,雇用汪某某、严某某等60余名工...

乌克兰苏梅州一老人院遭袭 已致1死13伤

乌克兰苏梅州一老人院遭袭 已致1死13伤

当地时间19日,乌克兰苏梅州军政管理局通报称,当天下午苏梅州一所退伍军人老人院遭俄军航空炸弹袭击,已导致1人死亡、13人受伤。目前救援人员已将老人疏散到安全区域。俄罗斯方面目前对此暂无回应。(总台记者 王晋燕)(来源:央视新闻客户端)...

微信重大更新!网友直呼:终于等到你

微信重大更新!网友直呼:终于等到你

朋友圈 动~起~来~了~ 9月19日晚 微信官方发文 嚯,微信朋友圈 可以发实况照片了! 具体操作方式打开朋友圈-从手机相册选择,即可选中并发布实况照片,照片将包含动态画面和声音。发布时,也可以点击关闭实况效果,支持静态照片与实况照片混合发布。发布后,朋友...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。