中國科技和電商巨頭阿里巴巴集團於8月3日宣布,其雲計算部門推出了兩個開源人工智能(AI)模型,分別為Qwen-7B和Qwen-7B-Chat。根據新聞稿,這些模型被歸類為大語言模型(LLM),每個模型擁有70億個參數。此次發布的模型是阿里巴巴今年4月推出的通用模型“通義千問”縮小版。
這些模型的主要目標是將AI能力整合到中小型企業的運營中。Qwen-7B和Qwen-7B-Chat提供了一系列企業感興趣的功能。其中一個重要特點是,它們向全球的學術界、研究人員和商業組織“免費提供代碼、模型權重和文檔訪問權限”,這是公司聲明中提到的。
這是阿里巴巴首次在AI領域貢獻開源大語言模型,標誌着中國科技行業的一項重要發展。儘管如此,擁有超過1億月活躍用戶的企業需要獲得許可才能使用這些模型。此外,阿里巴巴於8月1日宣布對其AnalyticDB數據倉庫服務進行了向量引擎更新,使企業客戶能夠快速開發定製生成式AI應用程序。
該消息是在Meta和微軟於7月16日發布其開源Llama 2模型後公布的。Meta的Llama 2模型在更大比例的公共數據上進行了訓練,能夠處理比前一代多兩倍的上下文內容。儘管Llama 2是開源的,但擁有超過7億月活躍用戶的公司需要獲得許可證才能使用其最大版本。7月26日,阿里巴巴推出了“中國首個Llama 2全系列訓練和部署解決方案”,此前阿里巴巴已經開發了相關的AI軟件和工具,幫助企業實施Llama 2解決方案。






















