当前位置:首页 > 新闻资讯 > 正文内容

性能比肩DeepSeek,阿里开源最新推理模型发布即爆火

七夏8小时前新闻资讯10

阿里再度推进开源进程。3月6日,阿里凌晨发布并开源通义千问推理模型QwQ-32B。据悉,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。随后,千问推理模型QwQ-32B迅速登顶全球最大的AI开源社区Hugging Face大模型榜单。



据悉,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。同时,阿里还开展了大规模强化学习。“在初始阶段,特别针对数学和编程任务进行了大规模强化学习训练。与依赖传统的奖励模型(reward model)不同,我们通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行服务器评估生成的代码是否成功通过测试用例来提供代码的反馈。”通义千问团队称。

最近,针对开源阿里方面动作频频。就在2月25日晚,阿里云深夜抢先开源旗下视觉生成基座模型万相2.1(Wan)。阿里云该开源产品采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,在权威测评中,万相2.1也已经超越了Sora、Luma、Pika等国内外模型。

另外在2月25日日间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考(QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。

自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face信息,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。

采写:南都记者 林文琪

扫描二维码推送至手机访问。

版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。

本文链接:https://www.0538ta.cn/post/95499.html

分享给朋友:

“性能比肩DeepSeek,阿里开源最新推理模型发布即爆火” 的相关文章

海浪黄色警报:上海、浙江北部近岸海域将出现3到4米的大浪到巨浪

海浪黄色警报:上海、浙江北部近岸海域将出现3到4米的大浪到巨浪

国家海洋预报台9月19日08时发布海浪黄色警报:受今年第14号台风“普拉桑”(热带风暴级)的影响,预计:9月19日中午到20日早晨,东海将出现4到6米的巨浪到狂浪区,近海海域海浪预警级别为黄色;上海、浙江北部近岸海域将出现3到4米的大浪到巨浪,该近岸海域海浪...

一场月饼引发的风波:“三只羊”遭遇直播带货信任危机背后

一场月饼引发的风波:“三只羊”遭遇直播带货信任危机背后

中秋前夕,“疯狂小杨哥”及其旗下直播间带货的“香港美诚”月饼,因被曝“在香港买不到”,引发巨大的舆论风波,造成直播带货行业震荡。随后,销售方和生产方的属地监管部门相继回应。但此前合肥当地秒删“多次约谈”的通报内容引发广泛争议,被质疑是“地方包庇企业”。截至目...

A股收评:沪指放量收涨0.69%,近4800只个股上涨

A股收评:沪指放量收涨0.69%,近4800只个股上涨

A股三大指数今日集体上涨,截至收盘,沪指涨0.69%,深成指涨1.19%,创业板指涨0.85%,北证50指数涨1.24%,沪深京三市成交额6294亿元,较上日放量1477亿元。两市近4800只个股上涨。板块题材上,白酒、乳业、食品加工制造等泛消费板块涨幅居前...

敏感时刻,以色列宣称挫败一起暗杀阴谋:73岁老人被招募,试图暗杀总理、国防部长等

敏感时刻,以色列宣称挫败一起暗杀阴谋:73岁老人被招募,试图暗杀总理、国防部长等

在黎巴嫩接连发生寻呼机、对讲机爆炸事件引发中东动荡及全球关注之际,当地时间19日,以色列国家安全局(俗称“辛贝特”)突然宣布了一则重磅消息称,该局挫败了一起未遂的暗杀阴谋,一名以色列商人在土耳其、伊朗等国受到招募,试图暗杀以色列总理内塔尼亚胡、国防部长加兰特...

全球最贵古代书画《十面灵璧图卷》领衔,15件国宝齐聚广州

全球最贵古代书画《十面灵璧图卷》领衔,15件国宝齐聚广州

9月13日—10月13日,“盛世仰止——宋元明清国宝书画特展”在广州·鹏瑞1号湾颂艺术中心举行,展品包括成交价5.129亿元的全球最贵古代书画《十面灵璧图卷》在内的15件宋元明清国宝传世佳作,总估值近20亿,为广州首次超高规格国宝级古代书画珍藏特展。据悉,开...

直击合肥地震震中梁园镇:有少数老房子开裂,老人担心余震一夜没合眼

直击合肥地震震中梁园镇:有少数老房子开裂,老人担心余震一夜没合眼

极目新闻记者 丁伟 张奇“当时房子突然开始晃,我们就赶紧冲到外面,拖鞋掉了都没再穿上。”9月19日,在安徽合肥肥东县4.7级地震的震中梁园镇,村民陈年端向极目新闻记者回忆着前一晚的惊险瞬间。9月18日晚,安徽合肥肥东县发生4.7级地震,震源深度12千米,震中...

知名教育机构秦汉胡同被列入失信经营!深圳公司欠费458万

知名教育机构秦汉胡同被列入失信经营!深圳公司欠费458万

9月19日,深圳市消费者委员会公布了7家失信经营者信用信息,知名教育机构秦汉胡同上榜。据公告,深圳市秦汉胡同教育培训有限责任公司因收取预付款后停止营业被列为失信企业,深圳市消费者委员会共收到171宗相关投诉,涉案金额超过458万。8月28日,深圳市福田区消委...

科大讯飞、酷狗等样品 存听力安全隐患

科大讯飞、酷狗等样品 存听力安全隐患

  中消协近期公布了36款无线耳机产品的比较实验结果。  随着人们对娱乐设备需求的日益丰富,耳机已经成为消费电子必备品,而与有线耳机相比,无线耳机因其便携性和舒适性已经成为消费者选购耳机的热门类型。那么,哪些无线耳机的音质更好又佩戴舒适呢?  近日,中国消费...

河南高校一食堂窗口暂停营业,大学生排队“随礼”!

河南高校一食堂窗口暂停营业,大学生排队“随礼”!

近日,话题#双向的善良双向的爱#登上热搜,引起网友的关注和讨论。在河南职业技术学院,一食堂档口上演了温暖的一幕,老板的爱人生子,他拉起横幅告知师生暂停营业的原因,“吾妻生子 暂停营业 待我归来欢迎全校师生前来吃糖”,学生在横幅上写满了祝福语。许多网友看到满横...

北京算力互联互通和运行服务平台上线

北京算力互联互通和运行服务平台上线

9月19日,数智“新”北京暨2024北京互联网大会在京召开,会上,北京市算力互联互通和运行服务平台上线,目前平台已汇聚京内外29家算力服务商,算力资源超五万P(1P约等于每秒1000万亿次的计算速度)。通过该平台,算力能像水、电等资源一样随用随取。(北京日报...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。