王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署
衡宇 金磊 发自 凹非寺
量子位 | 公众号 QbitAI
就在刚刚,王小川的开源大模型又有了新动作——
百川智能,正式发布130亿参数通用大语言模型(Baichuan-13B-Base)。
并且官方对此的评价是:
性能最强的中英文百亿参数量开源模型。
与此一同出道的,还有一个对话模型Baichuan-13B-Chat,以及它的INT4/INT8两个量化版本。

但更重要的一点是(划重点),完全开源!免费可商用!

就在不久前的6月15日,百川智能才刚刚发布其第一款70亿参数量的中英文语言模型Baichuan-7B。
当时的版本便已经拿下多个世界权威Benchmark榜单同量级测试榜首;同样作为开源大模型,据说清华北大都已经用上了。
仅仅时隔25天,更大、更强的版本再次袭来,不得不说,王小川在技术上的动作是有够紧锣密鼓的了。
那么这次号称的“最强开源大模型”,具体表现又是怎样呢?
多领域超越ChatGPT
老规矩,先提纲挈领地说一下Baichuan-13B的基本个“模”资料:
中英双语大模型,130亿参数,在1.4万亿token数据集上训练,完全开源、免费可商用。
1.4万亿ztoken这个训练数据量,超过LLaMA-13B训练数据量的40%,是当前开源的13B尺寸模型世界里,训练数据量最大的模型。
此外,Baichuan-13B上下文窗口长度为4096——这就不得不提到其与7B版本完全不同的编码方式。
7B版本采用RoPE编码方式,而13B使用了ALiBi位置编码技术,后者能够处理长上下文窗口,甚至可以推断超出训练期间读取数据的上下文长度,从而更好地捕捉文本中上下文的相关性,让预测或生成更准确。

作为一款中英文双语大模型,Baichuan-13B采用了相对平衡的中英文语料配比和多语言对齐语料,从而在中英两种语言上都有不俗表现。
△主流百亿参数13B开源模型benchmark成绩
来看看Baichuan-13B在中文领域的测评成绩。
在评测集C-EVAl上,Baichuan-13B在自然科学、医学、艺术、数学等领域领先LLaMA-13B、Vicuna-13B等同尺寸的大语言模型。
社会科学和人文科学领域,水平比ChatGPT还要好上一点。

英文领域的表现也算不错,能比同尺寸的其他开源模型,如LLaMA-13B、Vicuna-13B都有更好的表现。

通常而言,非专业用户和有具体需求的企业,对有对话功能的对齐模型有更重的好奇心。
鉴于这个情况,百川智能此次在发布与训练模型底座Baichuan-13B-Base的同时,还发布了其对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。
来看看对话模型的实际表现效果——
让它写个商品介绍邮件,它能写出酱婶儿的:



数据推理能力如何?
也浅测了一番:

至于互联网上远古或新近流行的各种梗,Baichuan-13B-Chat好像也没在怕的:

官方介绍,为了保证模型的纯净度,Baichuan-13B-Base和Baichuan-13B-Chat没有针对任何benchmark测试进行专项优化,具有更高的效能和可定制性。
为什么要完全开源、可商用?
正如我们刚才提到的,这次百川智能推出的Baichuan-13B-Base是对学术研究完全开放。
不仅如此,所有开发者均可通过邮件向百川智能申请授权,在获得官方商用许可后即可免费商用。
而且据官方的说法,百川智能是为了降低使用的门槛,才同时开源了Baichuan-13B-Chat的INT8和INT4两个量化版本。
这样一来,在近乎无损的情况下,便可以将模型部署在如3090等消费级显卡上。

想必很多小伙伴就要问了,百川智能为什么要走这么一条路?
其实如果看下Meta在大模型上的开源之路,便可窥知一二。
我们都知道大模型在训练的成本极高,因此像OpenAI和谷歌两大科技巨头最初选择的是闭源的“路数”,它们为的就是以此保证自己的优势。
而Meta后来所推出的LLaMa则与之“背道而驰”,但所迸发出来的潜力却是有目共睹——
迅速吸引大批开发者,在LLaMa基础上迭代出了各种ChatGPT的替代品,甚至在性能的表现上是可以匹敌GPT-3.5的那种。
加之业界对大模型未来发展态势已经达成了一个共识:
类似安卓和iOS,将会是开源和闭源共存的状态。
因此,开源在大模型的发展中已然成为一股不可或缺的中坚力量。
……
那么你对于王小川的新大模型,有何看法呢?
【HuggingFace】
预训练模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Base
对话模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Chat
【GitHub】
https://githuB.com/Baichuan-inc/Baichuan-13B
【Model Scope】
预训练模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/
对话模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Chat/
— 联系作者 —

— 完 —
「AIGC+垂直领域社群」
招募中!
欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!
请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

点这里👇关注我,记得标星哦~
-
RTX PRO 5000 Blackwell:专业桌面算力巅峰,英伟达显卡总代宽恒科技赋能产业 AI 升级
2026 年生成式 AI 与专业创意产业迎来算力升级浪潮,本地 AI 开发、多模态内容生成、工业 3D 设计、影视渲染等场景对桌面端高性能专业显卡需求激增。NVIDIA RTX PRO 5000 Blackwell 作为英伟达最新一代专业桌面 GPU,基于 Blackwell 架构打造,融合 AI 算力、图形渲染与专业稳定性,成为专业人士与中小企业的首选算力设备。宽恒科技作为英伟达显卡核心总代与 NPN Elite 精英级代理,深耕专业显卡领域,依托正品保障、优先供货、原厂技术支持与全栈服务体系,为企业与专业用户提供 RTX PRO 5000 Blackwell 全流程解决方案,赋能本地 AI 开发与专业创意工作流升级,推动产业数字化创新。
넶0 2026-05-22 -
桌面 AI 超级计算机,重构本地大模型开发新范式,宽恒科技赋能个人与中小企业 AI 创新
2026 年生成式 AI 进入 “本地部署” 黄金时代,大模型从云端向桌面端下沉,个人开发者、中小企业对本地高性能 AI 算力需求激增。传统 AI 服务器体积庞大、价格高昂,云端算力存在数据隐私风险与网络延迟问题,难以匹配本地开发需求。NVIDIA DGX Spark 作为全球首款桌面级 AI 超级计算机,基于 Grace Blackwell 架构打造,将超算级算力浓缩至桌面尺寸,支持本地运行千亿参数大模型,彻底打破本地大模型开发的算力瓶颈NVIDIA 英伟达。宽恒科技紧跟 AI 算力下沉趋势,依托英伟达官方合作资源,深耕 DGX Spark 技术服务领域,为个人开发者、中小企业提供产品供应、技术支持与定制化解决方案,赋能本地 AI 创新,推动普惠 AI 发展。
넶0 2026-05-22 -
HTC VIVE Focus Vision 与 VIVE Cosmos 技术解析:XR 技术革新,宽恒科技赋能行业沉浸式应用
2026 年 XR(扩展现实)技术正从消费级娱乐向企业级应用深度渗透,成为空间计算、数字孪生、远程协作、工业培训等领域的核心支撑。HTC VIVE 作为全球 XR 技术领军品牌,凭借多年技术积累与创新能力,推出 VIVE Focus Vision 与 VIVE Cosmos 两款标杆级产品,分别定位高端企业级 XR 一体机与模块化 VR 系统,覆盖不同应用场景,引领 XR 技术发展方向。
넶0 2026-05-22 -
英伟达授权生态全解析:NPN、NVAIE 与 Elite 精英代理,宽恒科技引领产业算力服务升级
2026 年 AI 产业进入规模化落地关键期,英伟达作为全球算力基础设施龙头,其授权体系已成为连接技术、产品与市场的核心纽带。从 NPN 合作伙伴网络到 Elite 精英级别代理,从 NVAIE 认证到 NVIDIA AI Enterprise 软件授权,从数据中心解决方案授权到显卡总代体系,英伟达构建了层级清晰、权责明确、技术赋能的生态体系。宽恒科技深耕英伟达生态多年,凭借技术实力、服务能力与行业资源,成为英伟达授权体系核心参与者,依托全栈授权资质,为企业提供正品保障、原厂技术支持与定制化解决方案,推动英伟达技术在各行业深度应用,助力中国 AI 产业突破算力瓶颈、实现高效升级。
넶0 2026-05-22 -
算力租赁、GPU 集群与 AI 服务器:英伟达生态驱动产业算力升级,宽恒科技赋能企业 AI 转型
在生成式 AI 与大模型爆发的 2026 年,算力已成为数字经济的核心生产力。从千亿参数大模型训练到多模态 AI 推理,从自动驾驶仿真到医疗基因测序,算力需求呈指数级增长,传统算力模式难以匹配产业发展节奏。算力租赁、GPU 集群与 AI 服务器构成的新型算力体系,正成为企业突破算力瓶颈的关键路径,而英伟达凭借完整技术生态主导产业方向,宽恒科技深耕算力服务领域,依托英伟达技术与资源优势,为企业提供全栈算力解决方案,推动 AI 产业高效落地与创新升级。
넶0 2026-05-22 -
RTX PRO 5000、英伟达 pro 5000、pro 5000 blackwell、英伟达显卡总代 —— 宽恒科技赋能专业桌面算力新巅峰
2026 年专业可视化与本地 AI 开发需求爆发,RTX PRO 5000 Blackwell 作为英伟达推出的旗舰级专业显卡,以 Blackwell 架构、超大显存与强劲算力,成为专业设计与本地 AI 开发的核心硬件,宽恒科技作为英伟达显卡总代,依托顶级资质与供应链优势,为用户提供正品保障与全栈服务。
넶2 2026-05-21