通义千问-7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的70亿参数规模的模型。
近日,阿里云开源了QWen-7B 和QWen-7B-Chat模型。目前,两个模型均已在AI模型社区「魔搭ModelScope」上线。
开源地址
- 魔搭ModelScope:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary- Hugging Face:https://huggingface.co/Qwen
- GitHub:https://github.com/QwenLM/Qwen-7B
Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。在Qwen-7B的基础上,阿里云使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。
通义千问-7B(Qwen-7B)主要有以下特点:
- 大规模高质量训练语料:使用超过2.2万亿tokens的数据进行预训练,包含高质量中、英、多语言、程式碼、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。
- 强大的性能:Qwen-7B在多个中英文下游评测任务上(涵盖常识推理、程式碼、数学、翻译等),效果显著超越现有的相近规模开源模型,甚至在部分指标上相比更大尺寸模型也有较强竞争力。
- 覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-7B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展。
可在魔搭社区找到相关的详情信息:https://modelscope.cn/models
#阿里云开源通义千问大模型免费可商用 #科技資訊 #中文开源技术交流社区
You may also like
No related posts.
近期文章
- 2024 年如何學習 Shopify 開發
- Shopify 太邪惡了!不要使用! Shopify 不會釋放我的資金 |預言性警告 | Shopify 付款
- 10 個讓你大吃一驚的 ChatGPT 黑客!
- 配置 Shopify POS – 預覽
- 得獎者 Ürün Bulmak Áçin Áhtiyacın Olan TEK 影片 (Shopify Dropshipping)
- 如何免費打造 7 位數的 Shopify 商店
- META 商務套件:終極教學 2024
- [FIL] Shopify Rebellion 與名詞 (BO5) | DreamLeague 第 24 季北美封閉預選賽總決賽
- 教學完整:Crearea Magazinului pe Shopify(Curs Gratuit Pas cu Pas Dropshipping)
發佈留言