阿里云宣布开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型,免费可商用
9 月 25 日消息,阿里云今日宣布開源通義千問 140 億參數模型 Qwen-14B 及其對話模型 Qwen-14B-Chat,免費可商用。
注:阿里云此前已經開源了 70 億參數模型 Qwen-7B,一個多月下載量破 100 萬。
通過阿里云給出的數據來看,Qwen-14B 在多個權威評測中超越同等規模模型,部分指標甚至接近 Llama2-70B。
據介紹,Qwen-14B 是一款支持多種語言的高性能開源模型,整體訓練數據超過 3 萬億 Token,具備更強的推理、認知、規劃和記憶能力,最大支持 8k 的上下文窗口長度。
相對的,Qwen-14B-Chat 則是在基座模型上經過精細 SFT 得到的對話模型,可帶來更準確的內容,也更符合人類偏好,而且在內容創作的想象力和豐富度方面也有擴展。
今日起,用戶可從阿里魔搭社區直接下載模型,也可通過阿里云靈積平臺訪問和調用 Qwen-14B 和 Qwen-14B-Chat。
阿里云 CTO 周靖人表示,阿里云將持續擁抱開源開放,推動中國大模型生態建設。阿里云篤信開源開放的力量,率先開源自研大模型,希望讓大模型技術更快觸達中小企業和個人開發者。
模型零代碼創空間體驗地址:
https://modelscope.cn/stud/qwen/Qwen-14B-Chat-Demo
環境配置與安裝
-
python3.8 及以上版本
-
pytorch1.12 及以上版本,推薦 2.0 及以上版本
-
建議使用 CUDA11.4 及以上(GPU 用戶需考慮此選項)
使用步驟
注:PAI-DSW 的環境配置下運行(可單卡運行,顯存最低要求 11G)。
-
Qwen-14B-Chat 模型鏈接:
-
https://modelscope.cn/models/qwen/Qwen-14B-Chat
-
Qwen-14B 模型鏈接:
-
https://modelscope.cn/models/qwen/Qwen-14B
-
Qwen-14B-Chat-Int4 模型鏈接:
-
https://www.modelscope.cn/models/qwen/Qwen-14B-Chat-Int4
社區支持直接下載模型的 repo:
from modelscope.hub.snapshot_download import snapshot_downloadmodel_dir = snapshot_download('qwen/Qwen-14B-Chat', 'v1.0.0')
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的阿里云宣布开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型,免费可商用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: eclipse中ast_JavaPars
- 下一篇: 苹果找回删除的照片