央广网北京8月7日消息(记者卜叶)近日,一款名叫“妙鸭相机”的微信小程序走红网络,用户上传21张照片就能生成逼真的艺术写真,支付9.9元,引来无数网友尝试。由于尝试的用户过多,该应用算力资源一度紧张。
与此同时,该应用的用户协议引发网友关注,“我方在全世界(包括元宇宙等虚拟空间)范围内享有永久的、不可撤销的、可转让的、可授权的、免费的和非独家的许可,使得我方可以任何形式、任何媒体或技术(无论现在已知或以后开发)使用您的内容”,这意味这用户上传的照片以后很可能被用作他用。
(资料图)
针对网友关心的问题,央广网采访了赛迪研究院未来产业研究中心高级咨询师钟新龙。
记者:这款应用基于哪些技术?技术的成熟度如何?该技术通常被用于哪些领域?
钟新龙:由于开发团队并未公布技术细节,从可行技术路径来推测的话,这款应用比较类似于去年年底在海外比较火的一款名为Lensa的AI照片应用,曾排名iOS商店“照片和视频”分类第一。从Lensa的技术解构来看,大概率是在Stable Diffusion等开源大模型的基础上,微调出的一个新模型。从写真的生成风格和质量来看,可能是用到了LoRA模型技术(Low-Rank Adaptation of Large Language Models,这是一种微调大型语言模型的技术,能实现少量数据就可以训练出特定特征),当前AI画图界的两大头部应用,Midjourney和StableDiffusion就普遍使用了该项技术。
从成熟度来说,妙鸭相机背后的AI模型名为“提香”(Tiziano),这个模型可能也是采用类似架构开发的模型,妙鸭相机的写真这一核心功能本质上是调用模型修改图片背景和风格以实现写真,从便捷度和业务领域的专一性来说,妙鸭相机的走热属于预期性产品。
记者:有网友评论该应用有望替代传统照相馆,您怎么看?
钟新龙:那就得看这个有望的时间窗口期得给多久了。从长远和比较理想的角度来看,如果AI图片生成技术足够好,定制化程度足够高,确实可以取代,但从现实和当前技术发展路径来看,替代非常专业的传统照相馆依然有很大难度。一是生成质量仍有限制。部分生成图片仍有一定缺陷,细节处理不够精细,与专业摄影师的作品,尤其是高端写真风格还有一定差距。二是个性化程度不高。其风格固定,无法根据不同用户需求调整风格,但专业的传统照相馆通用可以提供更几百种风格可供选择。三是特殊场景处理能力不足。如婚纱、儿童、团体等照片,对场景和细节控制要求更高,当前生成质量依然不够高。
记者:您如何看待AIGC技术现阶段的应用和未来发展?
钟新龙:从现阶段的应用来看,当前阶段AIGC已展示出强大的应用潜力,特别是在图像、文本、音频生成等创作型内容上的展现。部分关键应用领域包括生成辅助创作、新媒体内容等初步显现助力产业升级和催生新业态新模式。当前技术障碍主要在于生成内容的质量、逻辑一致性和可解释性,之后的研究需要在这些方面取得进一步突破。但也应注意AIGC的负面影响,如生成假新闻、欺诈内容等。需要政策监管和技术治理来保证健康发展。
从长远来看,AIGC有望成为广泛应用的通用性基础技术,类比于成为下一个“互联网技术”,未来有望深刻影响人类生产、生活、教育、娱乐等各个方面,带来新机遇的同时,也会带来新挑战,需要各界多元参与来锚定其发展方向。