关于 AIGC 的十问十答
1、AIGC 是什么?
AIGC(Artificial Inteligence Generated Content),指的是通过人工智能技术自动生成内容的生产方式。
2、AIGC 能生成什么?
AIGC 目前的范围包括绘画、文字、音频、视频。主要的创作内容形式都可由 AI 生成,更长远来看包括虚拟人行为与思维、游戏剧情与 NPC 交互等数字世界的绝大部分内容都可由 AI 生成,我们把 AIGC 看做面向 Web3 时代的生产力工具。
3、AIGC 如何实现?
AIGC 领域的技术包含了:生成对抗网络(GAN)、变微分自动编码器(VAE)、标准化流模型(NFs)、自回归模型(AR)、能量模型和扩散模型(Diffusion Model)。总体趋势来看,大模型、大数据、大算力是未来的发展方向。
目前两个常用的模型是【生成对抗网络 GAN】和【扩散模型 Diffusion Model】,算法模型的突破是近年来 AIGC 得以快速突破的催化剂。这两种模型的实现原理如下:
1)对抗式生成网络 GAN
GAN,是一种深度神经网络架构,由一个生成网络和一个判别网络组成。生成网络产生“假”数据,并试图欺骗判别网络;判别网络对生成数据进行真伪鉴别,试图正确识别所有“假”数据。在训练迭代的过程中,两个网络持续地进化和对抗,直到达到平衡状态,判别网络无法再识别“假”数据,训练结束。
GAN 模型的生成基于生成期和判别期的,这会导致也是可以做这个创作,但创作之后不确定性非常强,可能生成了一张图,但是不是你想要的就很难说。另外,更多是在一个生成,一个判别,是对原始图的模仿做的,这一块会导致生成的图像质量分别率比较差的。因此主要用于 AI 实验室,而更常见于商业应用的扩散模型。
2)扩散模型 Diffusion Model
扩散模型的生成逻辑相比其他的模型更接近人的思维模式,也是为什么近期 AIGC 拥有了开放性的创造力。本质上,扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过反转这个噪声过程来学习恢复数据。训练后,我们可以通过简单地将随机采样的噪声传递给学习的去噪过程来生成数据。
从更技术的角度来看,扩散模型是一个潜在变量 (latentvariable) 模型,通过马尔科夫链映射到潜在空间。马尔可夫链是状态空间中经过从一个状态到另一个状态的转换的随机过程,下一状态的概率分布只由当前状态决定。在这一过程中逐步添加高斯噪声来获得近似的后验概率 q(𝑥 ! |𝑥!”#),其中𝑥 # ……𝑥 ! 均是潜在变量,并且它们的维度与原图𝑥$ 一致。
扩散模型中添加的高斯噪声是一种概率密度函数符合正态分布的函数,当 AIGC 运用扩散模型来生成内容的时候,是通过在一副纯白的画布 ( 随机白噪声 ) 上逐步去噪来生成最终的目标画作。即用户给出的文本描述形容词,来从一个模糊的概念逐步具象。我们可以简化为多个正态分布函数的叠加,模型选择其中重叠的区间输出,这也是一个逐步缩小范围的过程。这与人类的思维模式很类似。
简言之,在 AI 训练阶段,我们将数据集中上亿组图文对进行训练,提取特征值;生产过程中,通过添加文字描述,引入不同的特征值进行去噪,从而生产一副 AI 理解下的内容 作品。例如,在当我们在脑海中想象一个画面的时候,比如:一只柯基通过一个小号玩火焰。我们的思维模式也是先有一只柯基,再去想象小号和火焰,最后将这些元素叠加在柯基身上。
4、AIGC 目前的效果如何?
以下截图来自我们亲自体验 AIGC 项目。
无界版图(https://www.wujiebantu.com/ai)
输入:一名女分析师正坐在办公室写关于 AIGC 的报告,透过窗子可以看到外滩的夜景
输出:
Mid-journey(https://www.midjourney.com/)
输入:a female analyst is sitting in the office and writing a report about AI generated content, through the office windows there is a night view of the Bund in Shanghai
输出:
Jasper生成的报告(https://www.jasper.ai/)
输入:write a article about AI generated content, should include the definition, history, usages, current development and opinions about future, with details and example。(大意:写一篇 AIGC 文章,须包含定义、历史、用途、目前的发展和未来的观点,需要有细节和案例)
输出:
5、AIGC 的效果取决于什么?
模型、数据、算力
算法模型:
首先取决于算法模型,相比于其他模型,扩散模型的优势在于生成的图像质量更高,且无需通过对抗性训练,这使得其训练的效率有所提升。同时,扩散模型还具有可扩展性和并行性。目前大部分公司采用开源的生成模型,例如 stable diffusion、disco,但也有的平台基于自己整体的模型实现 AIGC,如 mid journey。开源模型类似于安卓这类开源系统,不同的公司还可在其上实现定制开发,以适应不同风格和需求。
而通过相同扩散模型实现的 AIGC,其效果取决于数据集与模型训练。前者需要大数据,后者需要大算力。
数据集:用于训练的图文对的数量和质量都会影响到生成效果。目前主流的文本编码器是来自于 OpenAI 的 Clip 模型,其通过 4 亿组文字 – 图片对进行训练,但由于图文对绝大部分时英文内容,对中文的支持较弱。因此,高质量的图文对训练素材库也是 AIGC 的核心竞争力。
模型训练:在用图文对实现模型训练的过程中,需要庞大的算力支持,算力决定了训练的数据量从而决定了训练效果。
6、AIGC 有什么应用场景?
就目前而言,内容产业中的许多内容生成都已经有 AIGC 的影子。
媒体配图
巴比特全面拥抱 AIGC,采用 AI 生成图片为头条文章配图
文案编写
Jasper 已经开始为谷歌、脸书等知名公司提供文案 AIGC 的商业服务。
代码生成
GitHub Copilot 是一个 GitHub 和 OpenAI 合作产生的 AI 代码生成工具,可根据命名或者正在编辑的代码上下文为开发者提供代码建议。官方介绍其已经接受了来自 GitHub 上公开可用存储库的数十亿行代码的训练,支持大多数编程语言。
音频剪辑
AIGC 生成音频早被应用于我们的日常生活当中。我们常用的手机导航,可以切换不同明星甚至于卡通人物的语音提示。这是通过提前请明星或卡通人物的配音朗读完成一个语音库,再通过反复的训练学习使得可以用指定的声音说出任何话。我们自己也可以通过高德地图录制自己的语音导航包。而更深层次的应用将会是虚拟人领域,AIGC 不仅可以生成虚拟人的声音,并可以创造出说的内容。虚拟人在未来有望和我们一样表达自己的想法,灵魂逐步显现。
7、AIGC 的版权属于谁?
AIGC 属于前沿领域,目前处于大众使用的初期,对于版权归属问题行业尚无定论。主要有两种看法,一类认为内容由素材库训练生成,本身来自于素材库,需要对相关的素材作者提供版权付费。另一类认为整个 AIGC 产生内容的过程是一个完全随机且创新内容的过程,不存在版权问题,版权归属于 AIGC 的用户或者平台(视平台的具体规定而定)。目前的实践中,第二种为主流情况,但干净且合规的训练数据集对长期商业合规性仍有帮助。
8、AIGC 的商业化落地?
AIGC的商业模式类似于 Saas 服务,对 B 端和 C 端收取订阅费用。以 jasper 为例,成立还不满两年的独角兽企业 Jasper 在最新一轮的融资里获得了 1.25 亿美元资金,目前估值为 15 亿美元。用户可以通过文字描述让 Jasper 帮助完成文章的创作、创建广告话术,而不会存在抄袭的嫌疑。目前,Jasper 拥有 7 万多名客户,包括 Airbnb、Ibm 等企业。仅 2021 年一年便创造了 4000 万美元的收入,今年预估收入为 9000 万美元。
这个领域非常新,商业模式的探索有很大潜力。例如图库型的收益方式,AIGC 图片平台会积累出庞大的无版权问题的原创图片,配合图库搜索能够媲美现有的图库服务。AIGC 社交网络的结合也是值得关注的方向,相较于现有 UGC 平台,AIGC 进一步降低了创作门槛,让更多用户参与到内容的创作分享中。在未来的一两三年里可能以工具收费为主流,但长期来看会像当今互联网一样有五花八门的各种各样的应用。
AIGC的成本主要在于需要庞大的算力,以无界版图为例,目前拿的都是比较高端的 A40 这种,整个训练的长度都是百张以上的高端显卡做的。另外一种像 C 端整体我们做画的时候基本上使用的 V100、A100,以及刚才提到的相对高端的卡做,目前云计算的整体算力支持比较通用的。在每天创作量大几十万时,数百张卡同时支撑才能支持这么大的创作量。
9、如何看待 AIGC 与元宇宙未来发展?
从主题投资的角度看,区块链、元宇宙、Web3 均描述了数字经济时代中宏大的应用场景,而去年被资本市场关注的虚拟人、NFT 等只是其中的具体应用之一。我们认为,AIGC 将是推动数字经济从 Web2 向 Web3 升级的重要生产力工具:一方面,其对现有的杀手级应用——短视频、游戏等具有颠覆式影响,或进一步扩大内容量、提高成瘾性,同时对社交和广告提供新的工具;另一方面,Web3 开放、共建的价值观下,UGC、AIGC 的内容会更具吸引力,二次创作、开放想象的浪潮将来临。目前 AIGC 已成为硅谷最新热门方向,国内一级市场、互联网大厂等对 AIGC 应用关注度也在快速提升中。
10、AIGC 的投资标的有哪些?
本文节选自国盛证券研究所已于 2022 年 11 月 13 日发布的报告《国盛区块链 | AIGC__Web3 时代的生产力工具》,具体内容请详见相关报告。宋嘉吉 S0680519010002 songjiaji@gszq.com
特别声明:《证券期货投资者适当性管理办法》于 2017 年 7 月 1 日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
重要声明:本订阅号是国盛证券通信团队设立的。本订阅号不是国盛通信团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。
东港股份 | 嘉楠科技 | 公链 2020H1 | 漫画区块链 |
比特币 UTXO | 比特币挖矿初探 | 比特币挖矿产业链 | 比特币与黄金相关性 |
DCEP 专利分析 | DCEP 双离线支付 | DCEP 标的 | Libra |
区块链 + 电子发票 | 区块链 + 溯源 | 区块链 + 供应链金融 | 区块链标准委标的 |
韩锋 | 唯链 | 帅初 -Qtum | 段新星 -OKCoin |
孙鸣 – 法律专家 | 张原 – 比特大陆 | 咕噜 | 白硕 – 上交所前总工 |
余文波 – 分布式资本 | 张元杰 -Conflux | 吕国宁 -Nervos | 郑义 -Qtum |
孟岩 -CSDN | 陈雷 – 比特蓝鲸 | 周沙 – 区块链早期参与者 | 俞阳 – 矿海会 |
国盛通信区块链系列——【区块链深度】
2020.4.17 国盛区块链:一图看懂央行数字货币相关标的
2020.4.8 国盛区块链:三探中国央行数字货币:透过专利看“超级货币”蓝图
2019.9.24 国盛区块链:初探中国央行数字货币:目标、定位、机制与影响
2019.10.09 国盛区块链:再探中国央行数字货币:对电子支付行业有何影响?
2020.4.10 国盛区块链:科创未来(五):分布式账本给国际支付体系的启示
2020.3.1 国盛区块链:解决核心痛点,区块链开辟供应链金融新空间
2020.1.18 科创未来(四):以太坊 2.0 带来的分布式智能启示
2020.3.17 国盛区块链:暴跌之下,如何看待比特币资产属性与挖矿产业
2019.3.28 【国盛区块链专题】“链”接场景,开启数字产权新时代
2019.3.10 科创未来(一):区块链、AI 和 5G 融合将带来什么?,2019 年 3 月
2019.6.4 科创未来(二):区块链催生云算力市场,打造新一代 IT 基础设施
2019.9.15 科创未来(三):打造数据隐私之盾,释放数据红利
2016.2.28 区块链首次深入解读:巨头引领变革,区块链大有作为
2016.4.13 最通俗、最诙谐解读,阅读量过 12000【漫画区块链:我和小明的 2 块钱恩怨情仇】
2016.4.21 区块链行业跟踪:分布式总账联盟成立,区块链标志性事件出现
2016.7.5 没想到你是这种区块链!【国君通信·海外区块链风云榜(上)——底层技术谁领风骚?】
2016.7.6 区块链的红旗还能扛多久?【国君通信·海外区块链风云榜(中):合纵连横,平台初现】
2016.7.7 开启“区块链 +”的时代【国君通信·海外区块链风云榜(下):戒骄戒躁、精选场景】
2016.7.15 区块链帅得惊动 CCTV!国君通信宋嘉吉应邀解读投资机会
2016.8.9 IBM 与区块链的那些事儿 ——“链秀”全球区块链项目路演大会
2017.1.5 【国君通信宋嘉吉团队】电话会议纪要:最赚钱投资标的解读——如何投资比特币
2017.5.3 【国君通信宋嘉吉团队】善粮味道——区块链 + 农业最新案例分享!
2018.7.8 芯片创新 or 金融工具?——矿机行业深度研究
2019.7.12 听证会前,一图看懂 Facebook 加密货币 Libra
2019.7.19 Facebook 听证会深度解析:道阻且长,聚焦三大问题
2019.9.20 国盛区块链:这届“上海区块链国际周”,有何不同?
2019.10.1 国盛区块链:比特币“减半前最后一跌”?数字黄金的信心还稳吗?
2019.10.9 国盛区块链:PayPal 退出 Libra、跟监管正面刚,数字货币不容易啊!
2019.10.10 国盛区块链:如何看待比特币挖矿后市?(9 月公链观察)
2019.10.14 国盛区块链:数字货币在监管施压与国际认可中徘徊前行
2019.10.19 国盛区块链:第二批区块链信息服务通过备案,助力产业发展
2019.10.25 国盛区块链:扎克伯格出席 Libra 听证会,欲增美国金融领导力
2019.11.5 国盛区块链:政策的朝阳下映射出区块链未来发展图谱
2020.1.18 科创未来(四):以太坊 2.0 带来的分布式智能启示
2020.3.1 国盛区块链:解决核心痛点,区块链开辟供应链金融新空间
2020.3.17 国盛区块链:暴跌之下,如何看待比特币资产属性与挖矿产业
2016.3.20 对话区块链大佬 1:前沿探索——“和清华大学物理学博士聊聊区块链“
2016.4.19 对话区块链大佬 2:小蚁 Onchain 达鸿飞——【漫画区块链之应用篇:对不起,地球人……】
2016.6.1 对话区块链大佬 3:BitSE(唯链 Vechain)COO 陆杨——区块链在供应链溯源、防伪领域应用
2016.6.16 对话区块链大佬 4:《区块链新经济蓝图》主编、DACA 区块链联盟秘书长韩锋——区块链与意愿经济
2016.6.17 对话区块链大佬 5:OK Inc. 副总裁段新星——区块链:重塑经济与世界
2016.6.21 对话区块链大佬 6:世泽律所合伙人孙铭——DAO 遭遇黑客攻击的法律分析
2016.6.22 对话区块链大佬 7:比特大陆 CEO 助理张原——比特币矿机芯片的今天与明天
2016.7.12 对话区块链大佬 8:StoneLedger 创始人鲁斌——智能合约的前沿研究
2016.7.13 对话区块链大佬 9:小蚁 Onchain 创始人达鸿飞、VP 陶荣祺——区块链 ICO 究竟是什么鬼?
2016.7.19 对话区块链大佬 10:布比联合创始人杨帆——区块链商业应用如何落地?
2016.7.23 对话区块链大佬 11:巴比特 COO 屈兆翔——区块链能防止淘宝刷单?
2016.7.28 对话区块链大佬 12:FinTech 如何拥抱区块链?金丘实业(837901)为您解读
2017.6.10 对话区块链大佬系列 13:QTUM 发起人,帅初——解读 2017 最赚钱 ICO 项目
2018.7.28 对话区块链大佬系列 14:Ulord 谭林——解读“内容分发”公链
2018.10.24 对话区块链大佬系列 15:众托帮 CEO,乔克——由“相互保”大火,聊聊互助保险
2019.6.24 对话孟岩:Facebook 掀起数字货币浪潮
2019.6.26 对话井底望天:Libra“稳定不易”,将变革美国移动支付市
2019.11.11 对话上交所前总工白硕:区块链政策拐点下的机遇和隐忧
2019.11.11 对话分布式资本余文波:区块链产业投资的逻辑与思考
国盛通信区块链系列——【大话区块链】
2016.4.10 大话区块链(二)——去中心化?你几个意思?
2016.6.3 大话区块链(四):告别晦涩,说说大家都懂的理儿
2016.6.27 大话区块链(六):我们为什么如此看好区块链主题?
2016.8.30 大话区块链(七):Talkis cheap,show me the code
2017.8.14 大话区块链(八):平行世界里的疯子和骗子
2017.12.13 大话区块链(九):比特币、迅雷和云撸猫
2018.1.4 大话区块链(十一):梦百合携手唯链,海外区块链上市公司又在做什么?
2018.1.30 大话区块链(十二):当买矿机概念股时,你买的是什么?
2018.3.13 大话区块链(十三):台北遇到区块链
2018.3.30 大话区块链(十四):A 股上市公司区块链布局的昨天、今天和明天
2018.5.02 大话区块链(十五):QTUM 假期亮相,”卡牌对战“玩法渐多
2018.6.16【国盛区块链】比特币避险性的实证研究——大话区块链(十六)
2018.6.23 大话区块链(十七):一图看懂“交易挖矿”的市场竞争逻辑
2018.8.06 大话区块链(十八):你参加的同学聚会是否也要来场“币改”?
2018.8.31 大话区块链(20):一头猪告诉你为何没有比特币而只有 UTXO
2018.9.1 大话区块链(21):矿机追踪——新玩家露脸&悄然疯涨的算力
2018.9.8 大话区块链 (22):带上金箍,你还是那个比特币?
2018.10.08 区块链经济学脉络(二):市场结构、资源要素和竞争约束
2018.10.14 区块链经济学脉络(三):合约理论审视去中心化系统
2018.10.18 区块链经济学脉络(四):租值是算力市场价值的源泉
2018.10.27 区块链经济学脉络(五):从租值耗散看为什么 PoW 机制最高效?
2018.10.27 区块链经济学脉络(六):十年来欠中本聪多少比特币?
2018.11.13 区块链经济学脉络(七):社区与矿工的恩怨来自权利界定不明
2018.12.31 区块链经济学脉络(八):比特币、货币和价格锚定的误区
(向下滑动,查看更多)