中国科技和电商巨头阿里巴巴集团于8月3日宣布,其云计算部门推出了两个开源人工智能(AI)模型,分别为Qwen-7B和Qwen-7B-Chat。根据新闻稿,这些模型被归类为大语言模型(LLM),每个模型拥有70亿个参数。此次发布的模型是阿里巴巴今年4月推出的通用模型“通义千问”缩小版。
这些模型的主要目标是将AI能力整合到中小型企业的运营中。Qwen-7B和Qwen-7B-Chat提供了一系列企业感兴趣的功能。其中一个重要特点是,它们向全球的学术界、研究人员和商业组织“免费提供代码、模型权重和文档访问权限”,这是公司声明中提到的。
这是阿里巴巴首次在AI领域贡献开源大语言模型,标志着中国科技行业的一项重要发展。尽管如此,拥有超过1亿月活跃用户的企业需要获得许可才能使用这些模型。此外,阿里巴巴于8月1日宣布对其AnalyticDB数据仓库服务进行了向量引擎更新,使企业客户能够快速开发定制生成式AI应用程序。
该消息是在Meta和微软于7月16日发布其开源Llama 2模型后公布的。Meta的Llama 2模型在更大比例的公共数据上进行了训练,能够处理比前一代多两倍的上下文内容。尽管Llama 2是开源的,但拥有超过7亿月活跃用户的公司需要获得许可证才能使用其最大版本。7月26日,阿里巴巴推出了“中国首个Llama 2全系列训练和部署解决方案”,此前阿里巴巴已经开发了相关的AI软件和工具,帮助企业实施Llama 2解决方案。




















