阿里发布深度思考模型预览版,可联网搜索、推理和生成图片
2月25日早间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考 (QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。
阿里Qwen团队还预告称,在预览版本以外即将发布QwQ-Max 的正式版本,同步会发布Android和iOS应用程序,还会发布更小的可在本地设备部署的模型,如QWQ-32B等。
值得注意的是,在发布该新功能的同时,通义千问团队表示其获得了qwen.ai域名,南都记者实测发现,用户可以通过chat.qwen.ai访问千问聊天。与DeepSeek类似,Qwen Chat的交互界面左下方有深度思考(QWQ)和联网搜索两个选项,点亮这两个选项后,Qwen Chat就可以执行同DeepSeek一样的功能,同时还可以根据自然语言提示创建图像。
南都记者关注到,在近期由DeepSeek引发的深度思考模型热潮中,不少厂商或选择接入,或在接入的同时也推出自己的深度思考模型。其中,腾讯在接入DeepSeek以外,也于2月17日灰度测试腾讯自研的混元T1深度思考模型,同样支持长推理和联网搜索;百度则在其搜索首页上线DeepSeek-R1满血版支持联网搜索。截至目前,阿里千问尚未接入DeepSeek。另外据媒体报道,字节跳动旗下Al助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。
阿里近来在AI领域动作不断。2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。这也创下了中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。
今年1月底,阿里发布了AI基础大模型千问旗舰版Qwen2.5-Max,在多项权威基准评测中,处于业界领先水平。目前,Qwen的全球衍生模型已突破9万个,全球排名第一。除此以外,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。
采写:南都记者 林文琪
扫描二维码推送至手机访问。
版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。