大模型激战半年：王小川进击、王慧文退场，腾讯字节姗姗来迟

本文来源：时代财经作者：谢斯临

(相关资料图)

图片来源：Pixabay

国产通用大模型的混战远未结束。在半年左右的蛰伏期过后，大部分玩家都浮出了水面。

在这之中，有人加速迭代。8月8日，由搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品Baichuan-53B，背后训练参数高达530亿。此时距离王小川宣布进军大模型战场不过4个月的时间，这家创业公司进展神速。

这还只是一个开始，百川智能方面向时代财经透露，后续还会有多款产品发布，包括规模更大、参数超千亿的大模型。

也有人黯淡退场。由美团联合创始人王慧文创立，吸引源码资本、五源资本等知名VC机构，以及美团创始人王兴、快手创始人宿华等互联网大佬投资的光年之外，曾一度被市场认为是国内大模型战场上最强有力的玩家之一。

然而，随着6月下旬王慧文因健康问题离岗退出，无法继续执掌光年之外，这家备受期待的大模型创业公司只能卖身美团，一众投资人也随之退股。

还有人另辟蹊径。AI大牛周明创立的澜舟科技，强调轻量化模型，希望用更低的成本解决B端场景问题。而曾帮助谷歌将BERT模型的训练时间从3天降到76分钟的新加坡国立大学校长青年教授尤洋，则成立了潞晨科技，试图用低成本训练大模型的解决方案突围。

相比之下，大厂自研的大模型则姗姗来迟。直到8月初，腾讯自研的混元大模型和字节打造的AI对话类产品Grace才先后传出内测消息，具体面世时间仍未可知。

同样停留在测试阶段的，还有李开复创立的AI 2.0企业“零一万物”。在7月3日举办的对外交流会上，李开复透露，该公司在三个月内已实现百亿参数规模的模型内测，目前正向300亿—700亿参数规模扩大。不过，该产品至今仍未向市场开放。

这些仍未发布的大模型产品将为科技行业带来什么样的改变，值得市场期待。从这个角度来看，这场混战或许还要持续很久。

进击的王小川

由王小川创立的百川智能，正以其惊人的产品发布速度吸引市场的关注。

在其4月宣布下场做大模型后，仅用了两个月零五天的时间，就在6月15日发布70亿参数开源大模型Baichuan-7B。不到一个月时间，又发布了130亿参数开源大模型Baichuan-13B。

8月8日发布的Baichuan-53B，已经是这家大模型创业公司半年内发布的第三款产品，百川智能进展神速。

百川智能相关负责人回复时代财经表示，公司在创立之前就已经花了很多时间做前期准备，开始就把路线和方法想得比较清楚。

其指出，做大模型都会考虑三个层面：数据、算法和算力。抛开算力不说，做搜索的公司天然有优秀的数据能力，百川智能的核心团队此前已经做了20年的数据抓取、抽取、清洗、去重、反垃圾等操作，可以更快拿到高质量数据集。

而算法是以自然语言处理为中心，将算法工程进行迭代，不是单一的工程问题，而是在文本数据驱动下，算法和工程共同运行。此前在搜索领域积累的经验在这里也能很好地发挥作用，利用数据评价推动模型进步。

“有了之前多年的技术和经验积累，百川智能做大模型产品的速度才会又快又好。”

不过，在发布会上，王小川亦指出，当下国产通用大模型仍处在一个分型复刻的阶段。各家厂商基本都在对标OpenAI，不可避免地会出现同质化的问题。

正因如此，在他看来，与美国闭源大模型的头部格局已定的情况不同，“中国谁的大模型最好”现在并没有结论。在这场混战之中，钱是重要的，但最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多，但组织效率通常不一定够好，创业公司的组织效率可能好，也可能不好。

“大家都在争取机会，而且不一定落在大厂里。”

王小川还在采访中谈及退场的王慧文。其指出，王慧文是国内几个主流做大模型里唯一一个没有强势技术背景的，对他的挑战比其他家要大。工作中要做大量的技术决策，招什么人、走什么技术路线图、需要多少计算资源，一定会面临非常多的决策压力。

“不是做大模型压力大，是没有技术背景做决策压力会大很多。但是技术足够的话，其实挺愉悦的。”

腾讯、字节姗姗来迟

大模型混战开启之初，互联网大厂因为坐拥更多算力、人才、资金和数据，被认为是强大的竞争对手。

百度自研的文心一言早在今年3月底就已率先落地；阿里打造通义千问紧随其后，在4月11日举办的阿里云峰会上揭晓。就在阿里发布通义千问的前一天，王小川才刚刚宣布下场，成立百川智能。

相比之下，同为一线大厂的腾讯跟字节，推出通用大模型的步调要慢许多。

8月3日，据36kr报道，腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段。三天后，8月6日，字节旗下的AI对话类产品Grace也被爆出历经两个月的研发后，终于进入测试阶段。

此时距离百度发布文心一言已经过去4个月。对于腾讯通用大模型产品步调稍慢的原因，马化腾曾公开表示，“腾讯也一样在埋头研发，但是并不急于早早做完，把半成品拿出来展示。”

不过，“并不着急”的腾讯，还是在今年6月中旬率先公布了“行业大模型”的路线，一口气抛出10大行业超过50个解决方案。无独有偶，字节跳动也同样在6月发布大模型服务平台“火山方舟”，通过集成多家AI科技公司及科研院所的大模型，向企业提供全方位的平台服务。

市场曾一度认为，行业大模型将成为这两家大厂突围的方法。

但事实或许并非如此。当下被鼓吹的行业大模型始终存在着被替代的风险。科大讯飞总裁吴晓如曾向时代财经指出，10年前，在语音识别技术上，也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型，但随着通用模型技术的成熟，专用模型也随之退场。

“我认为大模型也会经历一样的阶段。”

相比之下，从更长远角度看，通用大模型才真正代表着一个平台级或颠覆性的大机会。正是因此，腾讯和字节都不可能放任自己错过，哪怕进度缓慢，但它们必定要坚持在场。

有腾讯内部人士向时代财经指出，腾讯的计划一直是两条腿走路，通用和行业齐头并进。只是与一些激进的厂商相比，旗下产品涵盖社交、游戏、广告、内容创作等多个领域的腾讯，要更为谨慎一些。

学院派创业者另辟蹊径

在大模型战场上，来自高校、研究机构的学院派创业公司组成了竞争的第三极。

它们既不是王小川、王慧文这样的种子选手，在创业之初就能凭借人脉吸引到数亿美元的投资，并以此迅速起步。也不像腾讯、阿里、百度这样的大厂，在算力、人才、资金等各个方面都占据难以逾越的优势。

但凭借着他们对于人工智能技术的深度理解，这些创业者仍然能在夹击之下，另辟蹊径找到新的发展方向。

比如由原微软亚洲研究院副院长周明创立的澜舟科技，不同于市面上一众追逐千亿乃至万亿参数的大模型产品，这位从1980年就开始研究NLP（自然语言处理）的华人AI大牛希望以更轻量级模型解决B端场景的问题。

其推出的孟子大模型曾以十亿参数，刷新此前被百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。

这是一项务实的决策。出于数据安全考虑，绝大部分企业都不会将数据上传，而是会要求本地化部署，成本因此被显著拉高。在接受媒体采访时，周明指出，哪怕只是本地部署推理，拿训练好的大模型来用，千亿参数大模型也需要8到16块 A100，换算下来至少是一两百万元的投入，“对很多场景来说，客户需要便宜和够用”。

由新加坡国立大学校长青年教授尤洋创立的潞晨科技，则希望利用算法技术降低大模型的调用成本。

现如今，无论是大厂，还是创业公司，都必须面对国产大模型同质化趋势愈发明显的问题。如果这一问题不被解决，未来大模型极有可能陷入当下云服务厂商面临的低毛利困境。

尤洋对时代财经表示，这是因为底层技术基座迭代成本过于高昂。他以GPT举例，OpenAI每一次的训练成本高达6000万美元，每隔三四个月就需要训练一次，迭代一次则需要四五次训练。以此计算，每迭代一次技术基座可能需要2亿到3亿美元。

过于高昂的成本导致市场上的技术基座极其稀缺。基本上只有GPT、LLAMA，还有国内的GLM。各家厂商基本都是在模仿这几家大模型做产品，才导致了同质化的问题愈发凸显。

长期研究高性能计算的尤洋因此成立了潞晨科技。该公司目前推出的开源系统Colossal-AI 可通过高效多维并行、异构内存等技术，显著降低AI大模型训练、微调和推理的开发与应用成本。

尤洋认为，只有伴随大模型训练成本快速下降，或者采取更好的优化技术，使得参数控制在200亿左右，还依然能够达到和千亿参数一样的效果时，才会真正迎来大模型百花齐放的那一天。

推荐内容

大模型激战半年：王小川进击、王慧文退场，腾讯字节姗姗来迟

洛杉矶二队6-0洛杉矶银河二队，弗洛雷斯双响，托雷斯建功

连日高温何时缓解？下一次降水过程在……

男子家中玩手铐铐住自己无法打开，求助消防解困

挖贝北交所周报：鸿智科技、华洋赛车上市 无锡晶海、广厦环能下周上会

汽车如何换挡（如何换挡）

边疆利刃 高原尖兵——记“最美新时代革命军人”成林

平均年龄28岁 47名青年信号工合肥开展技能比武

无惧A股下跌，大资金扫货358亿！

意媒：国米与萨马尔季奇团队重新展开谈判，可能周一前达成协议

爆料：C9青训天才小将与主队一起打训练赛拉胯，Sh1ro 50杀不敌Faze（虚构）

DNF普通装扮兑换券怎么用_装扮兑换券怎么用

快捷酒店价格，为何直追星级酒店？

488家药企去年销售费用超3000亿，学术会议卷入反腐风暴，合规边界成争议焦点

在健康民居大药房调理月经是一种什么样的体验

电脑电源按钮怎么添加休眠选项

行业追踪|玻璃市场（8月7日-8月13日）：5.0mm玻璃价格环比小幅上涨

下周新股发行一览表

脑动极光IPO，刷新数字疗法商业想象

母猪难产急救指南 - 掌握正确的救助技巧，保护母猪和小猪的安全

恪尽职守 不畏艰险 冲锋在前

护士节护士们最想要的礼物 特殊节日里的特殊礼物

qq音乐打不开是怎么回事_qq音乐打不开怎么办

如何判断分时低点

超658亿！知名基金经理“组团”参与

“拜登经济学”是一场灾难

山东高密燃气闪爆已致2死2伤

邀您一起来高新区（新市区）看马术表演！

“15分钟眼健康诊疗圈” 泉州鲤城爱尔眼科门诊正式开业 守护古城百姓眼健康！

王小川：用电脑工作时间越长越会被ChatGPT取代 程序员是自己的掘墓人

湖南曾国藩故居，风水宝地

首款具有赛车血统的L88Corvette即将发售

某医院副院长家财万贯老当益壮，曾将一年轻女子搞到心脏骤停！

内蒙古苏尼特右旗报告2例鼠疫确诊病例

四川大学宁夏录取分数线 四川大学宁夏招生人数多少

招商储蓄卡金卡有必要吗 招商银行的储蓄卡金卡收费吗

荣耀80 Pro直屏版5G手机到手价2669

圆心科技自称系医疗科技公司却销售处方药 品牌及广告支出超亿元

科比谈凌晨4点的洛杉矶（你见过凌晨四点的洛杉矶吗

朱五六见过朱元璋吗（朱五六）

两宋人物志9：温温沂公，大志厚徳。桃李成蹊，春风无迹。—— 王曾（下）

无处不贪！北京一医院女护士长被查处，涉嫌严重职务违法

大跌原因曝光 周末四大消息

【打新必读】众辰科技估值分析，低压变频器和伺服系统(沪主板)

“江海共创 晋箐担当”研学沙龙活动在晋江举行

最新动态：俄国防部称成功拦截袭击克里米亚大桥导弹 乌克兰方面称大桥两次发生爆炸

中豫港务集团招募有限合伙人，归集资金投向“两河两港”项目

​“骂不赢不要钱”，长沙男“专业代骂”被拘 一单叫价百元

他人私自扣押房产证不还怎样解决好

美方执意安排赖清德“过境”窜美，外交部：将采取坚决有力措施

为什么智者乐水，仁者爱山？怎么才能成为一个君子？

文化演出惠百姓

在“烟火气”小店里 他们守着“家”和“未来”

广东5000名青年志愿者奔赴乡镇

惠州两地新增54条严管路段！

2023年8月13日正十五烷价格最新行情预测

东莞一动物园上百台无人机表演时同时坠落！园方：临时航空管控，无人伤亡

“月薪2万住不起汉庭如家”的背后

2025年汽车工业产值要达到万亿 深圳打造“新一代世界一流汽车城”凭什么？

国家防办、应急管理部：毫不松懈做好防汛救灾各项工作

揭秘拆解污水泵送女友的百日礼该怎么选

货拉拉广州分公司工会成立

天文知识_金星遇到月亮意味着什么？

里程碑，卡马文加迎来皇马生涯第100次出场

建馆40周年，全国首家红领巾博物馆见证少先队员们成长历程

工字钢不够长怎么对接

此致敬礼的格式应该怎样写（此致敬礼的标准格式）

草长莺飞——宏观和微观视角下的微信商业生态

五代史伶官传序（关于五代史伶官传序的基本详情介绍）

中国睡眠经济市场发展状况与消费者行为调研：2023中国睡眠经济行业市场规模将达到4955.8亿元

cf骂人空格代码_cf骂人空格

宁德爱尔眼科医院(关于宁德爱尔眼科医院简述)

上帝是什么星座金牛座还是什么 上帝是什么星座

杭州远洋西溪公馆迟迟不开盘 杭州远洋西溪公馆怎么样

海上风起绿电来（经济聚焦）

黑龙江东宁加紧转移安置涉汛地区人员

海南韩氏奖助学金发放仪式加了一场讲座 这场特殊的“家风家教课”震撼心灵

宽画幅扫描相机的一些笔记

尚志市受灾群众生活逐渐步入正轨

挖贝北交所周报：鸿智科技、华洋赛车上市无锡晶海、广厦环能下周上会

边疆利刃高原尖兵——记“最美新时代革命军人”成林

恪尽职守不畏艰险冲锋在前

护士节护士们最想要的礼物特殊节日里的特殊礼物

“15分钟眼健康诊疗圈” 泉州鲤城爱尔眼科门诊正式开业守护古城百姓眼健康！

王小川：用电脑工作时间越长越会被ChatGPT取代程序员是自己的掘墓人

四川大学宁夏录取分数线四川大学宁夏招生人数多少

招商储蓄卡金卡有必要吗招商银行的储蓄卡金卡收费吗

圆心科技自称系医疗科技公司却销售处方药品牌及广告支出超亿元

大跌原因曝光周末四大消息

“江海共创晋箐担当”研学沙龙活动在晋江举行

最新动态：俄国防部称成功拦截袭击克里米亚大桥导弹乌克兰方面称大桥两次发生爆炸

“骂不赢不要钱”，长沙男“专业代骂”被拘一单叫价百元

在“烟火气”小店里他们守着“家”和“未来”

2025年汽车工业产值要达到万亿深圳打造“新一代世界一流汽车城”凭什么？

上帝是什么星座金牛座还是什么上帝是什么星座

杭州远洋西溪公馆迟迟不开盘杭州远洋西溪公馆怎么样

海南韩氏奖助学金发放仪式加了一场讲座这场特殊的“家风家教课”震撼心灵

大连海洋大学研究生学院顾老师大连海洋大学研究生学院

自研龙骨转轴小米MIX Fold 3支持多角度悬停拍照模式跨度达90度

小学生钻进春秋航空维修库房夜探“飞机医生”

贝尔地板品牌介绍（贝尔强化地板贝尔实木地板品牌详情）

手机APP教程:亲宝宝app如何禁止亲子小报推送亲宝宝app禁止亲子小报推送的方法

安全员证书与安全员c证书哪个更好安全员资格证书和安全C证一样吗有什么区别

减税降费直达企业增添动力

迷笛喊笛粉来新疆尝美食乌鲁木齐迷笛音乐节最新一期视频发布，大秀新疆美食

新华视点丨精彩暑假不负所“托”

北京平谷玻璃栈道景区北京平谷玻璃栈道

新疆石河子开发区：抢抓施工黄金期项目建设动力强劲

ARJ21飞机完成高海拔演示飞行国产支线飞机向高原、特殊机场“亮剑”

发力“点盐成‘金’”——“全面推进盐湖环境生态保护”系列报道之二

厦门“多雨模式”开启警惕强对流天气

光伏发电项目有效助农增收

西安市喂子坪村突发山洪泥石流致2人死亡16人失联