作为一款在上线不到一年之后就在全球范围内引发了AI热潮的明星产品,ChatGPT现在的用户量非常巨大。其母公司OpenAI网站流量在4月份就超过了18亿,进入了全球流量排名前20。
(相关资料图)
然而,近期网络分析公司Similarweb公布的一组数据引发了人们对于AI产业泡沫化风险的担忧和讨论。2023年前5个月,ChatGPT全球访问量环比增幅分别为131.6%、62.5%、55.8%、12.6%、2.8%,增长幅度明显下降;6月份ChatGPT的访问量环比下滑9.7%,为其推出以来首次。
受此消息影响,ChatGPT概念相关个股出现了明显跌幅,盘中主力资金大量流出。
ChatGPT热的冷思考
作为史上用户增长最快的应用之一,ChatGPT引发了近几年一次全球性的科技应用狂欢。
有人说,对于知识型工作者来说,这就完全等于工业革命。还有人说,ChatGPT将像搜索引擎杀死黄页一样摧毁谷歌。于是,一批ChatGPT将替代的岗位耸人听闻般地传开。
ChatGPT属于自然语言处理NLP的范畴,核心是对文字信息的处理,随着信息大爆炸,人类大脑已经无法应对如此海量的信息,ChatGPT就有了用武之地。
而Open AI又非常明智地挑选了一个受众面最广,上手最容易的聊天机器人作为突破口不仅免去了用户教育,也触及到了范围广阔的各种语言受众。
从网民对ChatGPT体验结果来看,ChatGPT对于提供具体知识/内容的搜索会有强大的优势。但是,对于非具体知识/内容的搜索,准确性还有待提高,而且有明显的信息堆砌痕迹。
事实上,ChatGPT的水平和准确度,不仅取决于被训练的语言数据库的质量,也取决于使用它的人的水平和输入资料可靠性。
以ChatGPT为代表的预训练模型“机器人”,在预训练过程中需要“投喂”海量数据,才能使得模型能够成功理解人类语言并模拟出愈加真实的类人表达方式。
目前,用于ChatGPT语言模型训练的数据为2021年底前的数据,因此在一些最新的数据和事件方面它可能会存在滞后。这在一定程度上造成了ChatGPT在内容准确性和知识性上的短板。
更麻烦的是,这种未经授权获取文本数据的预训练方式已引发争议和不满。OpenAI首席技术官米拉·穆拉蒂在接受媒体采访时坦言,和其他聊天机器人一样,ChatGPT可能会编造事实,也可能会被坏人利用,需要政府部门尽早介入进行监管。
正因如此,对于人工智能生成内容不能全盘接收,要注意甄别风险、加强监管,正成为业界共识。
任何新技术出现,都会被视为颠覆者,因为这种说法会给人巨大想象空间。但历史证明,新技术和旧生态之间并非完全冲突,更多的是互相融合。
ChatGPT也是这样。目前看来,ChatGPT知识量丰富但逻辑性和创新性不足,可以作为一个辅助工具,但远远达不到大家想象中的一个工具解决所有问题的程度。
还有就是,商业驱动是ChatGPT爆火背后重要的推动力。
不少人认为,现在微软已经成为ChatGPT背后的最大赢家。微软分别于2019年、2021年对OpenAI进行了两笔投资。今年1月,微软再次宣布向OpenAI投资数十亿美元。据了解,这是目前人工智能领域规模最大的一笔投资。
从投资角度,在收回投资之前,微软将获得OpenAI 75%的利润分成,之后微软将持有OpenAI 49%的股份,OpenAI一旦开始盈利,在返还First close partners(FCP)后,75%的盈利将回报给微软。OpenAI预计,将于2023年、2024年分别实现2亿美元、10亿美元营收。
AI发展或开启新周期
新概念的提出有利于科技发展,就算短期内未能成功造福民众,但也是星星之火,给人描绘了未来可期提供研究方向。
简单回顾历史,人工智能发展经历三次“浪潮”起伏:
第一次浪潮(20世纪50-70年代):人工智能起步阶段,首次提出人工智能概念及少数成果,但由于算法理论薄弱及计算机性能缺陷导致无法支持应用推广;
第二次浪潮(20世纪80-90年代):以专家系统和日本第五代计算机为代表,专家系统的出现推动人工智能从理论走向部分实际应用,例如医疗、气象、地质等领域。但由于专家系统推理方法单一、数据量匮乏导致人工智能发展受限,再度进入停滞;
第三次浪潮(2000年以后):信息技术的蓬勃发展带来了行业数据量的爆发以及新型人工智能芯片的进阶,为人工智能的发展提供基础条件。同时理论算法不断沉淀,以机器学习、深度学习为代表的算法,在互联网、工业等领域取得了较好的应用效果,并且在图像识别、语音识别、自然语言处理等细分领域取得巨大进步。
算法、算力和数据是人工智能技术发展的三大驱动力。其中,学习算法的设计,决定设计出的“大脑”够不够聪明(模型的革新);要有高性能的计算能力,可以训练一个大的网络(芯片的革新);必须要有大数据(信息技术的发展)。
ChatGPT之所以备受关注,关键在于其背后的算法基于Transformer架构,这是一种使用自注意力机制处理输入数据的深度神经网络。
Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。它克服了传统的神经网络技术用浅层的预训练网络来捕捉单词,并无法解决一词多义等问题缺陷,而是优化了类人脑的一个学习过程,进而引发大家对万物皆可生成的思考。
整体而言,ChatGPT的火爆,对国内人工智能行业是重大利好。从一级市场表现看,2023年开年以来,赛道内初创公司受投资者持续追捧。
据CB Insights统计,ChatGPT概念领域目前约有250家初创公司,其中51%融资进度在A轮或天使轮。2022年,ChatGPT和生成式AI(AIGC)领域吸金超过26亿美元,共诞生出6家独角兽,估值最高的就是290亿美元的OpenA。
从二级市场表现看,出现了两条明晰的投资主线:一是围绕人工智能三大要素布局,短期关注软硬件配套的底层资源,二是中长期关注新一轮技术变革下新场景和新产品的创新落地。