阿里云宣布通義千問720億參數(shù)模型開源

今日,阿里云宣布開源通義千問 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio,目前已上線阿里魔搭社區(qū)。

阿里云宣布通義千問720億參數(shù)模型開源

今日,阿里云宣布開源通義千問 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio,目前已上線阿里魔搭社區(qū)。

本次開源的模型中除預訓練模型外,還同步推出了對應的對話模型,面向 72B、1.8B 對話模型提供了 4bit / 8bit 量化版模型,便于開發(fā)者們推理訓練。

阿里云此前已經(jīng)開源了 70 億參數(shù)模型 Qwen-7B 以及 140 億參數(shù)模型 Qwen-14B。

據(jù)介紹,Qwen-72B 搭載了強大的系統(tǒng)指令(System Prompt)能力,用戶只用一句提示詞就可定制自己的 AI 助手,要求大模型扮演某個角色,或者執(zhí)行特定的回復任務。

官方表示,Qwen-72B 在 10 個權(quán)威基準測評創(chuàng)下開源模型最優(yōu)成績,成為業(yè)界最強開源大模型,性能超越開源標桿 Llama 2-70B 和大部分商用閉源模型。

未來,企業(yè)級、科研級的高性能應用,也有了開源大模型這一選項。通義千問還開源了 18 億參數(shù)模型 Qwen-1.8B 和音頻大模型 Qwen-Audio。

至此,通義千問共開源 18 億、70 億、140 億、720 億參數(shù)的 4 款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實現(xiàn)“全尺寸、全模態(tài)”開源。

本文來自投稿,不代表科技訊立場,如若轉(zhuǎn)載,請注明出處:http://leeannwhittemore.com/article/601146.html

秋秋的頭像秋秋管理團隊

相關(guān)推薦

發(fā)表回復

登錄后才能評論