阿里發布Qwen2-Math：數學推理全球第一，超越GPT-4o和Claude-3.5

Qwen官方網站消息，8月8日，阿里發布了Qwen2-Math（1.5B/7B/72B）系列。Qwen2-Math是一系列基于Qwen2 LLM構建的專門用于數學解題的語言模型，數學推理能力全球第一。

Qwen團隊表示，Qwen2-Math是基于Qwen2大型語言模型構建的一系列專業數學語言模型，其數學能力顯著超越了開源模型甚至閉源模型（例如GPT-4o）。希望Qwen2-Math能夠為解決復雜的數學問題做出社區貢獻。

Qwen團隊表示，一系列數學基準評測結果表明，阿里最大的數學專用模型Qwen2-Math-72B-Instruct超越了最先進的模型，包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro和Llama-3.1-405B。

Qwen團隊介紹，Qwen2-Math的基礎模型以Qwen2-1.5B/7B/72B為起點，然后在精心設計的數學專業語料庫上進行預訓練。該語料庫包含大規模高質量的數學網絡文本、書籍、代碼、考試題目以及由Qwen2合成的數學預訓練數據。

團隊使用中英文的數學基準評測對Qwen2-Math-72B-Instruct進行評估。除了常用的GSM8K和Math基準評測，還加入了更具挑戰性的考試，例如，OlympiadBench、CollegeMath、中考、高考等。

深圳知名品牌

深圳企業創新紀錄

高端論壇

深圳工業大獎

深圳保健用品備案查詢