|
 |
|
頭銜:金融島總管理員 |
昵稱:花臉 |
發(fā)帖數(shù):69676 |
回帖數(shù):2164 |
可用積分?jǐn)?shù):17297926 |
注冊日期:2011-01-06 |
最后登陸:2025-05-09 |
|
主題:阿里通義千問3登頂全球權(quán)威開源模型測評榜
2025年05月06日 15:20 作者: 楊翔菲 溫婷 來源: 上海證券報·中國證券網(wǎng)
記者5月6日獲悉,國際權(quán)威大模型測評榜LiveBench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3(簡稱“千問3”)斬獲全球開源模型冠軍,并在指令遵循(Instruction Following)這一關(guān)鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級閉源模型,位列全球第一。
據(jù)了解,LiveBench榜單由圖靈獎得主、Meta首席AI科學(xué)家楊立昆(Yann LeCun)聯(lián)合紐約大學(xué)等機構(gòu)推出,從數(shù)學(xué)、推理、編程、語言理解等多個復(fù)雜維度全面評估大模型。因其采用動態(tài)更新的題庫,被譽為“全球首個無法作弊的模型基準(zhǔn)測試”。
在最新一期的LiveBench榜單上,千問3的表現(xiàn)與o4-mini、Claude3.7等頂尖閉源模型相當(dāng),并超越DeepSeek-R1取得了全球開源模型冠軍。同時,千問3還斬獲指令遵循這一細(xì)分領(lǐng)域的全球冠軍,說明千問3具備全球頂級的語言理解和生成能力。
4月29日凌晨,千問3宣布開源。作為國內(nèi)首個“混合推理模型”,其參數(shù)量僅為DeepSeek-R1的三分之一,性能全面提升的同時成本還大幅下降,引發(fā)大模型產(chǎn)業(yè)鏈連夜適配和接入浪潮。目前,英偉達(dá)、英特爾、高通、聯(lián)發(fā)科、AMD、ARM、華為昇騰、壁仞科技等芯片平臺都已完成了千問3的適配,北上津杭等十余地算力平臺也已接入千問3。截至目前,阿里通義已開源200多個模型,全球下載量超過3億次,千問的衍生模型數(shù)量超10萬,遠(yuǎn)超美國Llama,成為全球第一開源模型。
【免責(zé)聲明】上海大牛網(wǎng)絡(luò)科技有限公司僅合法經(jīng)營金融島網(wǎng)絡(luò)平臺,從未開展任何咨詢、委托理財業(yè)務(wù)。任何人的文章、言論僅代表其本人觀點,與金融島無關(guān)。金融島對任何陳述、觀點、判斷保持中立,不對其準(zhǔn)確性、可靠性或完整性提供任何明確或暗示的保證。股市有風(fēng)險,請讀者僅作參考,并請自行承擔(dān)相應(yīng)責(zé)任。
|