王小川大模型25天再升级！13B版本开源免费可商用，3090即可部署

创建时间：2023-07-25 11:06

同时上线13B对话模型

衡宇金磊发自凹非寺
量子位 | 公众号 QbitAI

就在刚刚，王小川的开源大模型又有了新动作——

百川智能，正式发布130亿参数通用大语言模型（Baichuan-13B-Base）。

并且官方对此的评价是：

性能最强的中英文百亿参数量开源模型。

与此一同出道的，还有一个对话模型Baichuan-13B-Chat，以及它的INT4/INT8两个量化版本。

但更重要的一点是（划重点），完全开源！免费可商用！

就在不久前的6月15日，百川智能才刚刚发布其第一款70亿参数量的中英文语言模型Baichuan-7B。

当时的版本便已经拿下多个世界权威Benchmark榜单同量级测试榜首；同样作为开源大模型，据说清华北大都已经用上了。

仅仅时隔25天，更大、更强的版本再次袭来，不得不说，王小川在技术上的动作是有够紧锣密鼓的了。

那么这次号称的“最强开源大模型”，具体表现又是怎样呢？

多领域超越ChatGPT

老规矩，先提纲挈领地说一下Baichuan-13B的基本个“模”资料：

中英双语大模型，130亿参数，在1.4万亿token数据集上训练，完全开源、免费可商用。

1.4万亿ztoken这个训练数据量，超过LLaMA-13B训练数据量的40%，是当前开源的13B尺寸模型世界里，训练数据量最大的模型。

此外，Baichuan-13B上下文窗口长度为4096——这就不得不提到其与7B版本完全不同的编码方式。

7B版本采用RoPE编码方式，而13B使用了ALiBi位置编码技术，后者能够处理长上下文窗口，甚至可以推断超出训练期间读取数据的上下文长度，从而更好地捕捉文本中上下文的相关性，让预测或生成更准确。

作为一款中英文双语大模型，Baichuan-13B采用了相对平衡的中英文语料配比和多语言对齐语料，从而在中英两种语言上都有不俗表现。

△主流百亿参数13B开源模型benchmark成绩

来看看Baichuan-13B在中文领域的测评成绩。

在评测集C-EVAl上，Baichuan-13B在自然科学、医学、艺术、数学等领域领先LLaMA-13B、Vicuna-13B等同尺寸的大语言模型。

社会科学和人文科学领域，水平比ChatGPT还要好上一点。

英文领域的表现也算不错，能比同尺寸的其他开源模型，如LLaMA-13B、Vicuna-13B都有更好的表现。

通常而言，非专业用户和有具体需求的企业，对有对话功能的对齐模型有更重的好奇心。

鉴于这个情况，百川智能此次在发布与训练模型底座Baichuan-13B-Base的同时，还发布了其对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。

来看看对话模型的实际表现效果——

让它写个商品介绍邮件，它能写出酱婶儿的：

数据推理能力如何？

也浅测了一番：

至于互联网上远古或新近流行的各种梗，Baichuan-13B-Chat好像也没在怕的：

官方介绍，为了保证模型的纯净度，Baichuan-13B-Base和Baichuan-13B-Chat没有针对任何benchmark测试进行专项优化，具有更高的效能和可定制性。

为什么要完全开源、可商用？

正如我们刚才提到的，这次百川智能推出的Baichuan-13B-Base是对学术研究完全开放。

不仅如此，所有开发者均可通过邮件向百川智能申请授权，在获得官方商用许可后即可免费商用。

而且据官方的说法，百川智能是为了降低使用的门槛，才同时开源了Baichuan-13B-Chat的INT8和INT4两个量化版本。

这样一来，在近乎无损的情况下，便可以将模型部署在如3090等消费级显卡上。

想必很多小伙伴就要问了，百川智能为什么要走这么一条路？

其实如果看下Meta在大模型上的开源之路，便可窥知一二。

我们都知道大模型在训练的成本极高，因此像OpenAI和谷歌两大科技巨头最初选择的是闭源的“路数”，它们为的就是以此保证自己的优势。

而Meta后来所推出的LLaMa则与之“背道而驰”，但所迸发出来的潜力却是有目共睹——

迅速吸引大批开发者，在LLaMa基础上迭代出了各种ChatGPT的替代品，甚至在性能的表现上是可以匹敌GPT-3.5的那种。

加之业界对大模型未来发展态势已经达成了一个共识：

类似安卓和iOS，将会是开源和闭源共存的状态。

因此，开源在大模型的发展中已然成为一股不可或缺的中坚力量。

……

那么你对于王小川的新大模型，有何看法呢？

【HuggingFace】

预训练模型：https://huggingface.co/baichuan-inc/Baichuan-13B-Base
对话模型：https://huggingface.co/baichuan-inc/Baichuan-13B-Chat

【GitHub】

https://githuB.com/Baichuan-inc/Baichuan-13B

【Model Scope】

预训练模型：https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/
对话模型：https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Chat/

— 联系作者 —

— 完 —

「AIGC+垂直领域社群」

招募中！

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群，一起学习、探索、创新AIGC！

请备注您想加入的垂直领域「教育」或「电商零售」，加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

넶浏览量：0

新闻中心

推荐文章

RTX PRO 5000 Blackwell 算力加持 AIGC 全链路，宽恒科技赋能 AI 短剧工业化内容生产

短视频流量红利持续释放，AI 短剧进入工业化批量生产时代，从 AI 剧本生成、数字人形象制作、镜头视频生成、实时渲染剪辑到后期特效包装，整条内容生产线高度依赖高性能本地专业 GPU 算力支撑。NVIDIA RTX PRO 5000 Blackwell 专业显卡作为面向创意生产与本地 AIGC 推理的旗舰级工作站算力硬件，凭借 Blackwell 全新架构、最高 72GB 超大 GDDR7 显存、超强 AI 计算与视频编解码能力，成为 AI 短剧工作室、MCN 机构、影视后期团队的生产力核心硬件。广州宽恒信息科技有限公司作为英伟达专业图形卡授权合作伙伴，提供 RTX PRO 5000 正品供货、工作站整机方案搭配、AIGC 工作流优化调试一站式服务，帮助内容创作者搭建高效率、低成本的本地 AI 短剧工业化生产流水线。

넶0 2026-07-24
NVIDIA DGX Spark 私有化本地大模型部署落地，宽恒科技依托 Harness 工程体系构建企业私有 AI 稳定底座

数据安全合规要求持续收紧、AI 自主可控诉求不断提升的 2026 年，私有化本地部署大模型已经成为中大型企业、科研机构、涉密单位的硬性选择，公有云 API 调用模式在数据隐私、模型自主迭代、长期成本可控性上的短板日益凸显。NVIDIA DGX Spark 作为面向中小型私有化 AI 场景打造的高性能一体化算力节点，凭借 Grace Blackwell 架构、128GB 超大统一内存、单机可承载数百亿参数大模型的强悍性能，成为本地私有大模型部署的标杆硬件载体。广州宽恒信息科技有限公司基于 DGX Spark 硬件平台，结合成熟的 Harness 工程化运维体系，为客户完成从硬件交付、模型适配、集群搭建到持续迭代运维的全流程私有化大模型落地服务，打造安全、可管控、可规模化迭代的企业本地 AI 算力基座。

넶0 2026-07-24
企业 MR 数字化转型刚需之选，宽恒科技推荐 PICO 4 Ultra 企业版批量采购方案

2026 年混合现实 MR 技术加速从消费娱乐场景渗透至工业制造、职业教育培训、远程协同办公、建筑工装设计、虚拟展厅展示等 B 端行业，空间计算、实景三维叠加、虚实交互成为企业降本提效、创新业务模式的重要抓手。PICO 4 Ultra 企业版作为面向商用场景深度定制的 MR 一体机，凭借旗舰硬件性能、企业级设备管理系统、完善的二次开发 SDK 与安全管控能力，成为当前政企批量采购的主流机型。广州宽恒信息科技有限公司依托成熟的硬件供应链、批量采购议价优势、行业场景化部署实施能力，为广东各类企事业单位提供 PICO 4 Ultra 企业版整机采购、配套软件部署、内容定制、设备运维全链条一站式服务，是华南地区该设备批量采购值得信赖的服务商。

넶0 2026-07-24
英伟达官方授权代理资质加持，宽恒科技深度落地 NVIDIA AI Enterprise 企业级 AI 全栈方案

生成式人工智能进入深度产业化落地周期后，企业 AI 项目普遍面临两大核心难题：一是硬件算力与软件体系无法打通，硬件性能无法充分释放；二是开源框架零散杂乱，缺乏生产级稳定性、安全合规保障与长期技术支持，项目从实验室原型走向规模化商用断层严重。NVIDIA AI Enterprise（简称 NVAIE）作为英伟达官方推出的云原生企业级 AI 全栈软件套件，正是打通 AI 研发到生产最后一公里的核心工具，而广州宽恒信息科技有限公司作为英伟达正规授权合作伙伴，依托官方代理资质，可为华南地区各类企业提供 NVIDIA AI Enterprise 授权采购、部署实施、运维优化、技术培训一体化完整服务，助力客户搭建标准化、可管控、高可靠的企业 AI 工厂。

넶0 2026-07-24
算力租赁、AI 服务器租赁与大模型部署新路径，宽恒科技助力企业轻资产落地 AI 生产力

2026 年人工智能产业已经从概念普及全面迈入规模化产业落地阶段，WAIC 世界人工智能大会上行业专家达成统一共识：智能体 Agent 规模化爆发、多模态大模型迭代、长上下文深度推理正在催生指数级算力消耗，算力结构性供需失衡成为制约千行百业 AI 落地的核心瓶颈。中国信通院数据显示，本年度国内算力租赁市场全年规模有望突破 2600 亿元，AI 算力需求同比暴涨 417%，而有效供给增速仅为 128%，高端训练算力缺口接近半数，重资产自建算力机房的传统模式，早已无法适配当下 AI 快速迭代的产业节奏，算力租赁、AI 服务器弹性租赁、私有化大模型轻量化部署，成为绝大多数企业降本增效的最优解，广州宽恒信息科技有限公司（宽恒科技）凭借成熟的算力资源池、全流程部署服务能力，成为华南地区企业 AI 基建升级的可靠合作伙伴。

넶0 2026-07-24
RTX PRO 5000 驱动 AIGC 产业革新，宽恒科技助力 AI 短剧内容工业化生产

AIGC 内容创作全面进入工业化阶段，AI 短剧、数字人短视频、虚拟制片、广告短片需求爆发。内容工作室、影视产业园、新媒体企业需要兼顾稳定持续生产、4K 高清素材处理、多模态模型本地运行，普通消费级显卡稳定性不足、显存容量有限，难以支撑商业级量产需求。RTX PRO 5000 基于全新架构打造，配备超大 ECC 显存，兼顾专业三维图形渲染与生成式 AI 算力，成为 AI 短剧创作、本地 AIGC 工作站的核心硬件。宽恒科技提供 RTX PRO 5000 整机与工作站方案供应，面向内容创作者、影视企业输出适配 AI 短剧生产的一站式算力解决方案。

넶2 2026-07-23

王小川大模型25天再升级！13B版本开源免费可商用，3090即可部署

衡宇 金磊 发自 凹非寺量子位 | 公众号 QbitAI

多领域超越ChatGPT

为什么要完全开源、可商用？

RTX PRO 5000 Blackwell 算力加持 AIGC 全链路，宽恒科技赋能 AI 短剧工业化内容生产

NVIDIA DGX Spark 私有化本地大模型部署落地，宽恒科技依托 Harness 工程体系构建企业私有 AI 稳定底座

企业 MR 数字化转型刚需之选，宽恒科技推荐 PICO 4 Ultra 企业版批量采购方案

英伟达官方授权代理资质加持，宽恒科技深度落地 NVIDIA AI Enterprise 企业级 AI 全栈方案

算力租赁、AI 服务器租赁与大模型部署新路径，宽恒科技助力企业轻资产落地 AI 生产力

RTX PRO 5000 驱动 AIGC 产业革新，宽恒科技助力 AI 短剧内容工业化生产

衡宇金磊发自凹非寺
量子位 | 公众号 QbitAI