财联社5月14日讯(记者 王全宝 赵相锋)随着大模型带来的新范式和新机会,大模型经济开始越发受到关注。


(相关资料图)

五一长假刚一结束,5月5日,二十届中央财经委员会第一次会议就强调要把握人工智能等新科技革命浪潮。人工智能等新科技再次被中央高层点题。

今年以来,由于ChatGPT的出色表现,人工智能领域已经掀起大语言模型开发浪潮,谷歌、百度、阿里、腾讯等头部大厂争相入局,相继发布产品。高校、科研机构亦在积极参与相关技术及应用的研发。

生成式人工智能为何能在短时间内做出突破?在社会结构及生产力水平提升方面将做出怎样的影响?中国将如何抓住本轮科技发展机遇?

中国电子商会元宇宙专业委员会理事长,北京国富资本有限公司董事长熊焰认为,ChatGPT可能会引发第四次工业革命,生成式智能将成为一个经济主体。未来将会出现人类智能与机器智能融合伴生,共同发展。

熊焰在接受财联社专访时还表示,中国在垂直领域应用上有很大的优势,因为中国产业链齐全,并且正好处在工业化数字化叠加,数字化能力快速发展的关键的阶段。在垂直领域小模型上争取突破,真正用数字技术赋能实体产业降本增效,这可能是一条可行路线。

“量的积累发生了质的变化”

财联社:人工智能的发展已有数十年的历史,而GPT如何能在短时间内做出突破?

熊焰:ChatGPT表现出非常令人惊艳的语言理解、语言生成、知识推理能力。它可以非常好地理解用户意图, 真正做到多轮沟通,而且回答问题内容完整,重点清晰、有概括、有逻辑、有条理,在绝大多数问题上超过了绝大多数的正常人。而且他还会拒绝回答不当问题。ChatGPT的成功表现,使人们看到了解决自然语言处理这一人工智能核心问题的可能性,并且被认为向通用人工智能迈出了关键的一步。

简单来讲GPT就是单字接龙,比如输入“不忘初”三个字,通过计算GPT会算出第四个字是“心”,然后以前面四个字为基础,再算第五个字。这是一种所谓自回归,把学到的所有东西作为他的已有的,然后结合你的提问,给你算出下一个字是什么。

实际上计算机对生成的内容并不了解,就是“鹦鹉学舌”,依据前文猜后文。基于统计语言学的思想,通过大量文本数据的统计分析和建模计算来学习语言的概率分布,从而生成具有语法和语义合理性的文本。他会把知识库中学到的语言规律提炼出来作出预测,这叫“回归”。同时还会把他看到的规律,举一反三,这就是所谓泛化。

与搜索引擎不同的是,ChatGPT得出的结论不是基于已有资料库里的原有答案,而是它自己生成出来的。恰恰是他造出来的,就潜在的出现了智能的可能性。

GPT的核心技术并没有什么颠覆性的、独门的、全新的,根据已有的资料分析,实际就是量的积累发生了质的变化。圈子里的两个重要词,第一个词叫“涌现”,当模型正确,参数够大,训练的数据量足够大的时候,在某一个临界点上突然出现了指标的跃升;另外一个词叫“统一”,原来文字与机器交流是一种方法,图像与机器交流是一种方法,现在这几个方法把它混合在一起叫“多模态”,可以在各个模态下都用这一个方法。现在的问题是涌现、统一的机理、这个机器智慧到底是怎么生成的,这些问题还有不可解释性,全球顶尖的科学家,对这个机制还有些说不太清楚。

财联社:目前很多大厂都在加码大语言模型的研发,GPT本身更新迭代的速度也在加快,GPT是如何实现进行技术突破的?具有哪些基础与条件?

熊焰:第一是人工智能算法的加速发展。人工智能到现在为止大概有七十几年历史,从1950年开始启动,前40年叫小规模专家训练阶段。到1990年开始进入了所谓浅层机器学习,用了大概20年左右的时间。到了2010年开始深度机器学习,浅层与深层的差别就是用了很多叠层的计算机给它摞在一起,三层以上算深层,例如GPT-3是96层摞在一起算。2018年开始进入预训练,到现在大约用了5年的时间突破。人工智能算法进入了倍速发展阶段,每隔前一段的一半时间,一个新的划时代的算法出现了。

第二是算料,实际就是数据。团队给GPT-3喂了45TB的无标志数据,包括维基百科、Books Corpus,后来又挑了大概1%的有标注的数据去规范和引导。

第三是算力,过去10年是算力爆炸性增长的十年,全球算力大约增长了10万倍,这是OpenAI能突破的重要的技术能量基础。OpenAI团队在GPT-3上用了13万片GPU ,这是一种加速计算芯片,现在已经成了生成智能革命的最核心的卡脖子资料了。

第四,OpenAI团队是一组年轻的科技狂人和最杰出的人工智能科学家,具有长期主义,并且他们没有短期回报的压力。团队最初的创始人就是在马斯克、彼得蒂尔和比尔盖茨的支持下做这件事,现在来看投入已经是百亿美元的强度了。他们做了一个非常好的混合式股权模型,一开始是一个非盈利机构,但后来由于投资强度太大,非盈利模式扛不住。微软作为第一大股东投了100亿美元,但是他已经对外承诺,当财务投资回报的上限达到100倍之后,它又回归为非盈利机构。

“最重要的是质疑能力、判断能力与创造能力”

财联社:GPT的出现对社会的贡献体现在哪些方面?

熊焰:现在主要的语系包括印欧语系、汉藏语系等等,官方语言100多种,如果加上地方方言上可以达到千种之多,隔几十里的人就没法交流了。ChatGPT的出现,有可能消除人与人之间的语言沟通的障碍。

GPT还将解决人与计算机的交流。软件工程师的工作就是人与机器之间的翻译,汇编语言、C语言的作用就是解决人与计算机的交流问题。自然语言处理就是希望用人类使用的普通语言文字与计算机交流,ChatGPT成功使得人与计算机交互的障碍基本解除了。

ChatGPT是目前被普遍认为第一个通过了图灵测试的人造智能体,它开启了人类通向通用人工智能的一个入口。如果按照智能智力测评,ChatGPT相当于斯坦福大学四年级本科生的智力,在绝大多数领域超过了绝大多数人的通识。在每一个细分领域,它相当于是大学毕业并工作5年的专业人士的水平。

从学术上讲,ChatGPT成功的解决了知识的表达与调用问题。知识的表达与调用一直是计算机科学的一个最重要的问题。过去人类的知识是以数据库的方式储存在计算机中,使用汇编语言可以把知识调出来,到了互联网时代就是用搜索引擎把知识调出来,现在到了生成智能时代,GPT就是智能时代的操作系统。

财联社:生成智能被认为是第四次工业革命,如何看待这一说法?

熊焰:OpenAI成功用一款产品把大家带入了一个生成智能的时代。它符合数字经济的一个很重要的特征:高建设成本,低使用成本。这个事具有很高的门槛,没有几十亿美金投入别想做成。但是客户使用成本极低,并且使用的人越多,它的质量提升越快,各种垂直应用越多越好。

ChatGPT可能引发第四次工业革命,生成式智能将成为一个经济主体。未来将会出现人类智能与机器智能融合伴生,共同发展。没有巨大的数据,就没有GPT这个产品,同时这个产品又在源源不断地生成新的数据,它将极大地提高劳动生产率。

首先是与知识相关的劳动生产力极大的提高,显然是一次生产力的革命。传统经济学的起点叫稀缺,对应于人的需求,任何要素都是不够的。数据是人与计算机合作的产物,计算机一天24小时不休不眠,数据源源不断,数据这个要素在生成智能的迭代推动下大量涌现。稀缺基础变了,成本、消费一系列的生产与再生产的逻辑关系都会发生变化。

财联社:人工智能会取代哪些人或职业?如何更好的利用这一新兴技术?

熊焰:掌握人工智能的人会取代没有掌握人工智能的人,比如大量接电话的客服、翻译、律师、一般的文员等靠过往知识为主的服务产业将完全被生成智能改变;对于科研、文化等知识生产领域,生成智能出现是一场重新洗牌。原来很多细分的领域的边界消失了,大模型一算,许多专业就没什么可研究了。

人类原本认为在几十年内解决不了的一些科学研究问题,比如小型可控核聚变、托卡马克模型,现在美国已经开始用Chat GPT来算,效率和质量都很高;对于教育和传媒等需要知识的传承与传播的行业,以传递已有知识为主的填鸭式教育显然不行了。原有的教育逻辑、教育规则、教育模式全都要改变了。最重要的是质疑能力、判断能力与创造能力。如果能提出一个问题,ChatGPT没听到过,这可能对全世界都是一个贡献。此外具有判断力变得很重要,ChatGPT的回答是生成出来的,所以判断力变得很重要,今后最稀缺的是创造能力。

职业出现两端化:一端是向手工业靠,另一端就是脑力创意。上周好莱坞作家们集体抗议游行,因为制片厂不给那么多稿费了,GPT写得更好;美国医生也开始抗议,盲盒问诊下ChatGPT的问诊的满意度46%,真人的问诊的满意度4.6%。金融行业方面,常规的客服、一般的文案问答,大概今后都会出现很大的变化;在信息行业,我身边创业团队就在做IT运维的Chat GPT。IT运维过去10年左右的累积,从小型机、PC服务器、路由器等,包括操作系统、中间件,适配。任何一个人问它任何一个问题,都可循迅速得到回答,整个运维成本就下来了,这就是Chat GPT垂直应用。

“我们要正视差距,形成合力,化解阻力”

财联社:“十四五”规划中多次提到聚焦人工智能关键算法、培育壮大人工智能等新兴数字产业,对此你认为如何把握大语言模型对中国人工智能及数字化产业所带来的机遇?目前存在哪些差距?

熊焰:大概春节前后,各个大厂都开始了行动。据说3月中旬的那一周,圈子里的人连续几天睡不着,OpenAI的GPT-4、微软的全家桶、百度的文新一言都在那段时间发布。包括科大讯飞、昆仑万维、华为、达摩院、网易、阿里巴巴、百度、商汤、清华大学、腾讯、智源研究院、中科院等都在布局大语言模型。

我认为多数的创业团队实际做的是垂直应用,而大模型是参数在百亿以上的产品,应该是只有少数大厂能做的起,投资强度大约是大几十亿人民币起,而且对数据的要求非常高。前期投入、算力支持、核心团队、语料支撑,同时具备这几个条件的大概中国只有百度、阿里、字节、腾讯、华为等,其他产品可以理解为垂直应用的小模型。

一方面,要正视差距。中国在自然语言处理就是NLP领域在全球还是比较领先的,美国 CSRanking上个月发布全球高校自然语言处理排名,哈工大排名第一。中国在这个领域学术上并不差,然而在商业、工程和产品上面要想突破,必须要在模型、算力、算料、流量、机制、投入、人才方面都要跟上。

在大语言模型开发方面一定要集中力量办大事,一定是先做大模型,再做小模型。如果采用取巧方法,上来就看的那么准,沿着那一个地方进入,失败概率是非常大的。要形成合力,发挥我们国家集中力量办大事的优势。现在中国是百模大战,竞争和内耗都很厉害。不鼓励竞争是不对的,但是资源有限情况下,这种恶性竞争对形成突破是不利的。最起码在算法上我们内部要开源,做到标注数据复用。国家相关部门能不能做一些工作,让大家来形成合力。

另一方面,要化解阻力。美国设置了很多障碍,我们该做的就是更加开放,比如很多的测试环境搭到国外去。另外就是在产业应用上争取突破,中国在垂直领域应用上有很大的优势,因为中国产业链齐全,并且正好处在工业化数字化叠加,数字化能力快速发展的关键的阶段。在垂直领域小模型上争取突破,真正用数字技术赋能实体产业降本增效,这可能是一条可行路线。

我们正处在人工智能时代的起点上,生成智能将成为经济主体,人工智能与人类智能相互协同,共同向前走,生成智能将改变数据这个生产要素,生成智能将重构个人职业、社会结构和经济社会面貌。这是新时代的两弹一星工程,事关国运,因此我们要正视差距,形成合力,化解阻力,实现产业突破。

推荐内容