新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 阿里云宣布通義千問 720 億參數(shù)模型開源

阿里云宣布通義千問 720 億參數(shù)模型開源

作者: 時(shí)間:2023-12-01 來源:IT之家 收藏

IT之家 12 月 1 日消息,宣布開源 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio,目前已上線阿里魔搭社區(qū)。

本文引用地址:http://butianyuan.cn/article/202312/453485.htm

本次開源的模型中除預(yù)訓(xùn)練模型外,還同步推出了對(duì)應(yīng)的對(duì)話模型,面向 72B、1.8B 對(duì)話模型提供了 4bit / 8bit 量化版模型,便于開發(fā)者們推理訓(xùn)練。

IT之家注:此前已經(jīng)開源了 70 億參數(shù)模型 Qwen-7B 以及 140 億參數(shù)模型 Qwen-14B。

據(jù)介紹,Qwen-72B 搭載了強(qiáng)大的系統(tǒng)指令(System Prompt)能力,用戶只用一句提示詞就可定制自己的 AI 助手,要求大模型扮演某個(gè)角色,或者執(zhí)行特定的回復(fù)任務(wù)。

IT之家附模型鏈接:

-72B-預(yù)訓(xùn)練:

  • https://modelscope.cn/models/qwen/Qwen-72B

-72B-Chat:

  • https://modelscope.cn/models/qwen/Qwen-72B-Chat

通義千問-72B-Chat-Int8:

  • https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int8

通義千問-72B-Chat-Int4:

  • https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int4

通義千問-1.8B-預(yù)訓(xùn)練:

  • https://modelscope.cn/models/qwen/Qwen-1_8B

通義千問-1.8B-Chat:

  • https://modelscope.cn/models/qwen/Qwen-1_8B-Chat

通義千問-1_8B-Chat-Int8:

  • https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int8

通義千問-1_8B-Chat-Int4:

  • https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4

通義千問-Audio-預(yù)訓(xùn)練:

  • https://modelscope.cn/models/qwen/Qwen-Audio

通義千問-Audio-Chat:

  • https://modelscope.cn/models/qwen/Qwen-Audio-Chat

模型下載(以通義千問-72B-Chat-Int4 為例):

from modelscope import snapshot_downloadmodel_dir = snapshot_download("qwen/Qwen-72B-Chat-Int4")




關(guān)鍵詞: 阿里云 AI大模型 通義千問

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉