化工儀器網手機版
移動端訪問更便捷全新開源通義千問Qwen3,融合推理與非推理模式的最新模型來了
2025年07月28日 08:38:18
來源:化工儀器網 點擊量:320

除了數學和代碼能力,新模型在通用能力上也實現了飛躍。
Qwen3是通義千問系列的最新模型,融合推理與非推理模式,兼具QwQ和Instruct模型能力。提供多種尺寸,包括235B-A22B、30B-A3B及六個Dense模型,大幅提升數學、代碼、邏輯推理和對話能力,達到業界領先水平。旗艦模型Qwen3-235B-A22B在多場景測試中表現優異,小型模型如Qwen3-4B性能媲美大模型。
Qwen3有效融合推理模式和非推理模式,一個模型同時兼具之前QwQ模型(推理模式,用于數學、代碼、邏輯推理等場景)和instruct模型(非推理模式,通用對話等場景)的回復能力。
除了數學和代碼能力,新模型在通用能力上也實現了飛躍。在寫作(WritingBench)、Agent能力(BFCL-v3)、多輪對話和多語言指令遵循(MultiIF)等評測中,Qwen3-30B-A3B-Thinking-2507均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。這意味著,無論是撰寫文章、進行多輪對話,還是處理多語言任務,新模型都能表現得更加出色。
超多尺寸:兩款MOE模型:Qwen3-235B-A22B(2350多億總參數、 220多億激活參數)、Qwen3-30B-A3B(300億總參數、30億激活參數),以及六個Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B。
推理能力大幅提升:在數學、代碼和邏輯推理等評測中,顯著超過QwQ(推理模式)和Qwen2.5-Plus-Instruct(非推理模式),達到同規模業界SOTA水平。
模型人類偏好能力顯著增強:創意寫作、角色扮演、多輪對話、指令遵循能力均有明顯提升,用戶體驗預期明顯更佳,通用能力顯著超過Qwen2.5-Plus-Instruct。
Agent能力顯著增強:在上述兩種模式下都達到目前業界領先水平,能夠實現精準的外部工具調用。
相關閱讀 Related Reading
查看更多+-
為了更好的完善區域創新體系,提升區域創新能力和科技資源一體化配置能力,三省一市人大常委會于近日分別表決通過了《關于促進長三角科技創...2025-08-04 16:51:34
-
日前,江西省科學技術廳經組織申報、專家評審、現場考察等環節,現將2025年度江西省重大科技成果熟化與工程化研究項目擬立項予以公示。2025-08-04 16:26:27
-
2024年,中國工業機器人市場銷量達30.2萬套,連續12年保持全球最大工業機器人市場。2025-08-04 15:51:20
-
近日,中國科學院上海硅酸鹽研究所曾毅研究員團隊宣布,成功研制出國產高分辨電子背散射衍射儀(EBSD)樣機。2025-08-04 14:55:43
-
成都市首臺(套)重大技術裝備認定管理辦法及實施細則(試行)發布
《成都市首臺(套)重大技術裝備認定管理辦法及實施細則(試行)》正式發布,重點聚焦機器人、航空航天(含低空制造)、軌道交通、生物醫藥...2025-08-04 13:28:08 -
根據吉林省委、省政府關于科技創新的重大決策部署,吉林省科技廳現發布《吉林省科技發展計劃2026年度項目申報工作有關事項通知》。2025-08-04 12:00:11
版權與免責聲明
- ①凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- ②本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- ③如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。