阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507
创始人
2025-07-31 17:24:57
0

IT之家 7 月 31 日消息,阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:

  • 新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分,在代码能力测试 LiveCodeBench v6 中得分 66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著。
  • 在写作(WritingBench)、Agent 能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。
  • 更长的上下文理解,原生支持 256K tokens,可扩展至 1M tokens

此外,新模型的思考长度(thinking length)也增加了,官方推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥它的潜力。

官方透露,目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源,其轻量体积可轻松实现消费级硬件的本地部署;同时,其也在 Qwen Chat 上同步上线了新模型。

相关内容

热门资讯

北京城建集团董事长常永春被查,... 北京城建党委书记、董事长常永春。来源:北京城建集团官网 界面新闻记者 |白帆 近日,北京城建集...
原创 高... 声明:本文内容均引用权威资料结合个人观点进行撰写,文未已标注文献来源,请知悉。 最近,国际投行高盛...
大湾区酒价第15期|习酒窖藏1... 习酒窖藏1988多渠道价格跌至500以下,千元名酒价格小幅回升 今年“双11”,白酒价格波折不断。...
原创 玻... 作者:拉上窗帘 有朋友发来抖音视频,内容是福建曹德旺老板和他的私人飞机。 朋友问作者这是什么飞机? ...
2024年上半年经济总量出炉:... 今年7月份中旬,国家统计局发布了上半年经济情况,上半年GDP总量达到了616836亿元,同比增长5%...
疯狂小杨哥杭州办公总部出租,面... 据媒体报道,疯狂小杨哥杭州办公总部出租的消息引发关注。对此,三只羊集团方面回应称,公司即将搬迁,新地...
TK公会入驻最新行情分析,现在... 随着直播行业的迅猛发展,TikTok娱乐直播公会的入驻程序引起了众多内容创作者的热议。对于希望在这个...
陕西农信兴平联社召开2024年... 为全面总结上半年经营发展情况,深刻剖析问题,科学部署下半年重点工作,8月1日,兴平联社召开2024年...
2024上半年小红书营销:深耕... 近几年,短视频社交媒体平台已成为品牌营销的重要阵地。小红书,凭借其独特的UGC分享社区氛围、人群反漏...
「大算投」超越比特币?比肩以太... 在区块链技术浪潮的澎湃推动下,市场迎来了众多颠覆性创新项目,其中,Aleo以其独到的视野与尖端技术,...