自BERT出现之后,大模型成为AI领域的主流技术趋势,业界也因此掀起两轮热潮。国内外众多大厂、创业公司都在争先推出各自的大模型,字节跳动亦被认为将在今年年中推出大模型。
如今腾讯也出手了。6月19日,腾讯云发布MaaS(模型即服务)能力全景图,计划打造一站式行业大模型精选商店,以协助客户构建专属大模型及应用。腾讯云的入场,会给赛道带来什么?在激烈的竞争中,腾讯云有几分胜算?
(资料图片)
助力大模型落地
目前市面上谷歌、微软、百度、阿里等大厂公布的都是一个基础的通用大模型。与此前诸多公司急切高调推出的通用大模型不同,腾讯将更多的关注放在了面向B端的行业大模型身上。
腾讯云MaaS的技术底座是一系列的行业大模型,包括金融、政府、文旅、传媒、教育等。
基于这些基础模型,腾讯云的客户只要加入自己的场景数据,就可以生成契合自身业务需要的专属模型;同时也可根据自身业务场景需求,“量体裁衣、按需定制”不同参数、不同规格的模型服务。
如在医疗健康领域,腾讯云可以帮助医疗机构构建和部署自己的疾病预测模型,提高诊断准确率和治疗效果;在金融领域,腾讯云可以帮助银行和保险公司构建和部署自己的风险评估模型,提高风险控制能力。
腾讯选择这个思路,也不难理解。通用大模型需要利用大规模数据和先进的机器学习技术来训练和优化大型神经网络模型,但由于很多企业的业务数据等都是非常隐私的核心数据,他们根本不会将其放在数据集上进行公开训练,因此训练模型的专业、且高质量的数据收集是非常难的。
同时在通用大模型时,需要大量计算资源和漫长的训练周期。但是并非每家企业都有足够的资源,让大模型完成训练和推理,这对企业来说昂贵且耗时。英伟达曾公布数据显示,训练一次大模型,大约100多万美金。
但大模型在国内落地的需求却已刻不容缓,为了解决落地问题,推出更有针对性的行业大模型,并利用数据精调来满足业务需要,已经成为国内云服务商曲线解决当下困境的一种选择。
中金公司指出,腾讯AI大模型内外兼修,腾讯云的大模型能力可应用于腾讯会议等SaaS产品当中,将进一步加强产品的优势及提升变现潜力。
大模型落地挑战重重
在行业大模型落地的过程中,仍然有不少困难和挑战需要去解决。
一是计算资源问题。训练大型模型需要大量的计算资源和存储资源,与一般服务器相比,GPU服务器的稳定性比较低,大模型训练需要的GPU经常达到上千张卡。
对于许多企业来说,这可能是一个巨大的负担,因此寻找更高效的算法和硬件优化是解决这一问题的关键。
二是数据质量问题。训练大型模型需要大量的高质量数据,可现实情况却是,这些数据往往存在噪声、缺失值等问题,如果导入的数据质量低,那训练出来的模型也会有问题。
因此,研究人员需要采用各种方法来解决这些问题,例如数据清洗、去噪等,这也导致数据质量或不准确。
三是大模型的应用问题。当把大模型的能力落到某个实际场景的应用产品上时,由于没有参照,其实是并不好判断具体该如何用这些模型的。
虽然大模型在某些领域表现出色,但是它们并不一定适用于所有场景。因此,需要根据具体应用场景选择合适的模型。
此外,大型模型可能会泄露用户的敏感信息,如医疗记录、财务信息等。因此,保护用户隐私是非常重要的,这需要采取措施确保数据的安全性和隐私性,例如使用加密技术、限制访问权限等。
总之,大模型的落地面临着许多挑战,需要克服这些挑战才能实现其潜力。但从逻辑上讲,行业大模型一定会是在精度相对较低、容错率较高的行业先引用,再到精度要求高的地方去。
腾讯云有几分胜算?
在当前的大模型赛道中,谷歌、微软、亚马逊等科技巨头已经占据了主导地位,他们拥有庞大的数据集和先进的算法技术,能够训练出具有极高准确性和泛化能力的模型。
此外,国内的百度、阿里巴巴、腾讯等企业也在积极布局大模型赛道,通过自主研发和收购等方式获取更多的技术和数据资源。
腾讯的优势主要是其过去积累的庞大的业务数据和算力基础设施,如今腾讯云的解决方案,就是基于这些过去的积累,解决大模型应用落地的痛点。
一方面,腾讯旗下有多个不同的业务板块,多年来在金融、传媒、文旅、工业等不同领域积累了大量的数据和经验。以此为养料,腾讯云才能构建起一系列针对不同行业的行业大模型,同时针对一些特定的任务进行优化,从而确保使用时仅需少了数据就可以达到较好的精调效果。
另一方面,腾讯云在大模型算力方面拥有领先优势。早在今年4月,腾讯云便发布了面向大模型训练的新一代HCC高性能计算集群,采用最新一代腾讯云星海自研服务器,结合多层加速的高性能存储系统,具备3.2Tbps业界最高互联带宽,算力性能提升3倍。
腾讯还有自己的升级框架加速能力太极Angel,是其在人工智能领域的技术积累和创新成果之一,它采用了先进的异步调度优化、显存优化、计算优化等技术手段,可以显著提升大模型的训练和推理速度。
总之,腾讯入场大模型赛道将会对整个行业产生深远的影响,推动技术的进步和商业的发展。