Qwen官方網站消息,8月8日,阿里發布了Qwen2-Math(1.5B/7B/72B)系列。Qwen2-Math是一系列基于Qwen2 LLM構建的專門用于數學解題的語言模型,數學推理能力全球第一。
Qwen團隊表示,Qwen2-Math是基于Qwen2大型語言模型構建的一系列專業數學語言模型,其數學能力顯著超越了開源模型甚至閉源模型(例如GPT-4o)。希望Qwen2-Math能夠為解決復雜的數學問題做出社區貢獻。
Qwen團隊表示,一系列數學基準評測結果表明,阿里最大的數學專用模型Qwen2-Math-72B-Instruct超越了最先進的模型,包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro和Llama-3.1-405B。
Qwen團隊介紹,Qwen2-Math的基礎模型以Qwen2-1.5B/7B/72B為起點,然后在精心設計的數學專業語料庫上進行預訓練。該語料庫包含大規模高質量的數學網絡文本、書籍、代碼、考試題目以及由Qwen2合成的數學預訓練數據。
團隊使用中英文的數學基準評測對Qwen2-Math-72B-Instruct進行評估。除了常用的GSM8K和Math基準評測,還加入了更具挑戰性的考試,例如,OlympiadBench、CollegeMath、中考、高考等。
- 上一篇:新突破!中國科學家發現名為“反超
- 下一篇:我國量子計算機重大突破!這根“線