主題: 阿里通義千問3登頂全球權(quán)威開源模型測(cè)評(píng)榜
2025-05-06 16:01:19          
功能: [發(fā)表文章] [回復(fù)] [快速回復(fù)] [進(jìn)入實(shí)時(shí)在線交流平臺(tái) #1
 
 
頭銜:金融島總管理員
昵稱:花臉
發(fā)帖數(shù):69676
回帖數(shù):2164
可用積分?jǐn)?shù):17297926
注冊(cè)日期:2011-01-06
最后登陸:2025-05-10
主題:阿里通義千問3登頂全球權(quán)威開源模型測(cè)評(píng)榜


2025年05月06日 15:20 作者: 楊翔菲 溫婷 來源: 上海證券報(bào)·中國證券網(wǎng)

  記者5月6日獲悉,國際權(quán)威大模型測(cè)評(píng)榜LiveBench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3(簡(jiǎn)稱“千問3”)斬獲全球開源模型冠軍,并在指令遵循(Instruction Following)這一關(guān)鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級(jí)閉源模型,位列全球第一。

  據(jù)了解,LiveBench榜單由圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家楊立昆(Yann LeCun)聯(lián)合紐約大學(xué)等機(jī)構(gòu)推出,從數(shù)學(xué)、推理、編程、語言理解等多個(gè)復(fù)雜維度全面評(píng)估大模型。因其采用動(dòng)態(tài)更新的題庫,被譽(yù)為“全球首個(gè)無法作弊的模型基準(zhǔn)測(cè)試”。

  在最新一期的LiveBench榜單上,千問3的表現(xiàn)與o4-mini、Claude3.7等頂尖閉源模型相當(dāng),并超越DeepSeek-R1取得了全球開源模型冠軍。同時(shí),千問3還斬獲指令遵循這一細(xì)分領(lǐng)域的全球冠軍,說明千問3具備全球頂級(jí)的語言理解和生成能力。

  4月29日凌晨,千問3宣布開源。作為國內(nèi)首個(gè)“混合推理模型”,其參數(shù)量?jī)H為DeepSeek-R1的三分之一,性能全面提升的同時(shí)成本還大幅下降,引發(fā)大模型產(chǎn)業(yè)鏈連夜適配和接入浪潮。目前,英偉達(dá)、英特爾、高通、聯(lián)發(fā)科、AMD、ARM、華為昇騰、壁仞科技等芯片平臺(tái)都已完成了千問3的適配,北上津杭等十余地算力平臺(tái)也已接入千問3。截至目前,阿里通義已開源200多個(gè)模型,全球下載量超過3億次,千問的衍生模型數(shù)量超10萬,遠(yuǎn)超美國Llama,成為全球第一開源模型。

【免責(zé)聲明】上海大牛網(wǎng)絡(luò)科技有限公司僅合法經(jīng)營金融島網(wǎng)絡(luò)平臺(tái),從未開展任何咨詢、委托理財(cái)業(yè)務(wù)。任何人的文章、言論僅代表其本人觀點(diǎn),與金融島無關(guān)。金融島對(duì)任何陳述、觀點(diǎn)、判斷保持中立,不對(duì)其準(zhǔn)確性、可靠性或完整性提供任何明確或暗示的保證。股市有風(fēng)險(xiǎn),請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)相應(yīng)責(zé)任。
 

結(jié)構(gòu)注釋

 
 提示:可按 Ctrl + 回車鍵(ENTER) 快速提交
當(dāng)前 1/1 頁: 1 上一頁 下一頁 [最后一頁]