AI创作浪潮汹涌,布局两年多的昆仑万维站上“风口”?

导读 如何用AIGC支点,撬动元宇宙生态?作者 | 孙佳编辑丨高岩来源 | 野马财经“被AI的绘画技术整破防了”“AI会取代人类绘画吗”……这些近...


如何用AIGC支点,撬动元宇宙生态?

作者 | 孙佳

编辑丨高岩

来源 | 野马财经


“被AI的绘画技术整破防了”“AI会取代人类绘画吗”……这些近期挂在微博热搜榜上的话题,揭示了AI绘画的火爆程度。无论是自拍、合影,还是搞怪图片,只需应用AI绘画特效,就能一键转换为自己指定风格的精美绘图。这种开盲盒似的体验,让许多用户欲罢不能。

当人们成迷于AIGC(AI-Generated Content,人工智能生产内容)体验中的时候,也不禁对其背后的技术进展投注了更大兴趣。12月15日,昆仑天工AIGC技术发布会在线上举行。昆仑万维CEO方汉正式发布昆仑天工AIGC全系列算法与模型,并宣布模型开源。



昆仑天工旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力。这标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。

此时宣布开源,昆仑万维CEO方汉表示,“因为我们坚信开源是推动AIGC生态发展的土壤和重要力量。昆仑万维致力于在AIGC模型算法方面的技术创新和开拓,致力于推进开源AIGC算法和模型社区的发展壮大,致力于降低AIGC技术在各行各业的使用和学习门槛。”

昆仑万维的AIGC技术到底已经发展到了什么程度?能够将AIGC生态的发展助推到一个新高度吗?


模型突破,AIGC爆发


“成精”的AI,不仅能绘画,还能聊天。12月以来在科技圈刷屏的聊天机器人ChatGPT,面对网友们“调戏式”的提问,不仅对答如流,还能中英文丝滑切换,就连参加有“美国高考”之称的SAT考试也能考出排在全美前52%的成绩。

相关产品的出圈,让AIGC概念站到了聚光灯下。国盛证券研报称,AIGC代表新一轮范式转移的开始,其中在AIGC生成算法模型及数据集层面,可关注英伟达、Meta、百度、蓝色光标(300058.SZ)、昆仑万维(300418.SZ)等公司。

事实上,AIGC频繁见诸报端是今年才发生的事,这也是为何2022年被称为AIGC元年。其是继PGC(专业生产内容)和UGC(用户生产内容)后的又一种新型内容创作方式,此前虽然业界对AIGC研究已久,但一直难以实现质的突破。

招商证券研报中,将AIGC的发展分为三个阶段,分别是1950-1990年的早期萌芽阶段、1990-2010年的沉淀积累阶段和2010年至今的快速发展阶段。其迭代与人工智能深度学习的演进沿革密切相关。

要了解深度学习,就离不开机器学习的概念。这项技术的主要任务是指导计算机从数据中学习,然后利用经验来改善自身的性能。

在此基础上,深度学习开辟了机器学习研究中的新方法。其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,是2011-2020年最热门的AI研究主题。

最早出现的深度学习模型是2014年的GAN,其对输出结果的控制力较弱;2021年,CLIP模型横空出世,其已经能实现图像和文本的匹配;而2022年的最新深度学习模型Diffusion,不仅能高效合成视觉数据,还在视频生成、音频合成等其他领域展示出了不俗的潜力,直接推动了AIGC技术的突破性发展。

可以说,近两年AI深度学习的发展,是以天为单位计算的。以AI绘画为例,其实今年年初被大众熟知的AI绘画产品Disco Diffusion的缺点还较为明显,不仅无法刻画具体细节,还要耗费数以小时计的时间对图像进行渲染。


图注:天工巧绘生成作品

但这些缺点仅过了几个月就被新模型Stable Diffusion近乎完美的解决,后者可将模型的计算空间,在尽可能保留细节信息的情况下降维到一个称之为“潜空间”的低维空间里, 再进行繁重的模型训练和图像生成计算,大大降低了内存和计算要求。而且这款当今堪称最强大的AI绘画模型,已经于8月完全开源。

这种从前只会发生在《三体》等科幻小说中的“降维打击”情节,竟成为了现实,也难怪AIGC领域当下深受资本青睐。目前,大数据+AI公司Databricks估值已达380亿美元,开发出ChatGPT的OpenAI估值在今年10月超过200亿美元。同时,国内百度、腾讯、阿里巴巴、字节跳动、网易等大厂也正竞相入场。

AIGC的应用场景大致可以分为To B和To C两个赛道,其中B端主要通过“AI+”为产业进行赋能;C端主要通过与人交互进行内容生产。而招商证券又按照生成的内容形式,将AIGC分为了文字、图像、音频、视频和虚拟人五类。

另据Gartner预测,至2025年人工智能生成数据占比将达10%。红杉美国的两位合伙人在一篇题为《Generative AI:A Creative New World》的报告中表示,AIGC有潜力产生数万亿美元的经济价值。


游戏起家发力新赛道,AI模态两年覆盖全领域


AIGC走红后,两年前就开始对该领域进行全系列布局的昆仑万维受到了广泛关注。

登陆A股的2015年,昆仑万维的游戏收入占比达97%,境外收入占比达74%,公司IPO募集的13亿元也基本用于游戏的研发和代理,是一家不折不扣的海外游戏公司。

但在上市后次年,昆仑万维就联合三六零(601360.SH)收购了全球知名浏览器公司Opera,自此走上了互联网平台型企业的转型之路。7年时间里,昆仑万维一边收购资产,一边开发自研,目前业务已覆盖包括社交、娱乐、元宇宙、信息分发、搜索及游戏等在内的多个领域。

同期,昆仑万维一直坚持出海战略。截至今年上半年,公司的两个主要产品,Opera全球平均月活用户达3.3亿;海外社交娱乐领域头部平台StarX主打产品StarMaker累计在102个国家音乐/音频类畅销榜排名前五,其中84个国家位列第一。

事实上,早在两年前,昆仑万维已经开始全系列布局AIGC,投入数千万元,组建了二百余人的研发团队。2020年底至2021年4月,其研发出百亿参数的中文GPT-3模型,并于2021年8月开始研发基于自有大文本模型的对话机器人,迅速刷新国内技术指标。2022年1月启动SkyMusic音乐实验室,2022年4月达到人工智能领域最优效果;2022年9月启动编程、图像、文本方向的AIGC产品。

目前,昆仑万维推出的AIGC模型与算法昆仑天工,AI生成能力已覆盖图像、音乐、编程、文本等全模态领域,且其在四大模态领域均采用世界顶尖开源模型。

如AI图像方面,天工巧绘采用全球第一款多语言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5亿中英双语语料,支持中英双语输入实现文字生成图像,是国内为数不多的支持中英双语的文图生成模型。


图注:天工巧绘生成作品

AI音乐方面,天工乐府则采用了国内第一款商用级开源作曲AI模型,和弦准确率达92.5%,远超目前行业最佳64.7%;还支持31种语种、全球多个曲风,并能从旋律、文案素材生成歌词。

今年上半年,StarX成立的MusicX Lab音乐实验室发布了五首完全由AI作曲的歌曲,已在Spotify、SoundCloud、QQ音乐和网易云音乐等海内外180余个音乐平台上线;三季度,MusicX Lab再推10首新作AI歌曲,算法模型及AIGC能力不断优化提升。得益于此,目前StarMaker旗下K歌类产品Sing Star已是业内第一个可实现AIGC丰富内容供给的产品。

而AI编程方面,天工智码则采用全球第一款多语言开源编程大模型,能生成python、Java、C、php、swift等共计十余种编程语言,使不同语言的使用者都能来体验。

AI文本被方汉称作是公司下一个可能的发展重点。与之对应的是,天工妙笔采用生成效果最好的开源GPT中文预训练大模型,针对中文领域构建了千亿级别的高质量数据集,能提供包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等在内的各种功能。

图注:天工妙笔生成五言诗

不难发现,无论是哪一领域,昆仑天工都很重视多语言模型的开发、为全球的从业者和用户造福,这也与公司出海的战略遥相呼应。优质模型叠加丰富的数据集,让昆仑天工拥有强大的团队模型训练能力,并在同赛道上市公司中处于领先地位。

值得一提的是,目前AI图像、AI编程、AI文本的模型已经在GitHub上开源。“我们坚信开源是推动AIGC生态发展的土壤和重要力量。”方汉在发布会上称。


万亿新赛道,昆仑万维如何打开想象空间?


能让昆仑万维如此不遗余力地押注,AIGC到底有何魔力?或许将目光放到其背后的元宇宙可以找到答案。

虽然终极形态尚未确定,但业界的共识是,元宇宙将极大扩展人类的存在空间。而这样的空间需要大量的数字内容支撑,显然单靠人工设计和开发无法完全满足需求,AIGC刚好可以解决这样一个问题。

在此背景下,AIGC被视作“推动元宇宙发展的加速器”,亦或是“开启元宇宙的钥匙”。结合昆仑万维原本的元宇宙业务,AIGC或将赋予昆仑万维更大的想象空间。

一方面,AIGC可以实现降本增效,并增强应用的可玩性和功能性。还是以AI作曲为例:昆仑万维的游戏、StarMaker等产品中都需要植入海量音乐,而音乐本身创作成本较高,AI作曲则能在提高音乐品质的同时降低使用成本和音乐爱好者、独立音乐人的使用门槛。

方汉曾打过这样一个比方:“假设每款游戏的音乐成本在50万元至100万元之间,那么通过AIGC,我们的音乐成本就能够降至0。”

同时,这种模式也具备商业化潜力。近期昆仑万维方面表示,已经接到了采购AI创作歌曲的意向。目前看来,为企业用户提供音乐相关解决方案,包括批量供给背景音乐、伴奏配乐等泛化内容,或为艺人及虚拟偶像定制化创作符合其人设调性的音乐作品等服务,是AI作曲B端落地的重要方向。

另一方面,昆仑万维旗下各产品对接的海量用户提供的数据,还能帮助AIGC迭代,保持技术优势。2021年,StarMaker已经成长为除中国外全球最大的在线K歌娱乐社交平台。



“其实全世界做AIGC的公司非常多,但是昆仑万维的长处在于我们有音频方面的深厚积累。我们拥有全世界最大的伴奏带数据库,里面有相当多是已经被数字化的伴奏母带。人工智能非常依赖数据集,我们有这样高质量的数据集,对于AIGC非常有帮助。这是竞争对手短期内无法复制的。”方汉曾表示。

不只是AI作曲,昆仑天工在AI绘画、AI编程、AI文本方面的输出能力,同样能与昆仑万维的元宇宙业务形成协同效应。再结合昆仑万维此前在文娱、社交、游戏等不同行业的深度商业沉淀和领先的互联网运营能力,在行业人士看来,昆仑万维也有望成为元宇宙风口到来后最大的受益者之一。

对于AIGC或者元宇宙,你还有哪些了解的?留言区聊聊吧。

免责声明:本文由用户上传,如有侵权请联系删除!