AIGC(AI-Generated Content 人工智能天生内容)是最近一个热门的话题,伴随着大量运用的落地,AI天生图片、笔墨、音频乃至视频等内容也逐渐走入了人们的日常。刚刚几个小时前,红杉美国官网揭橥了最新一篇题为《Generative AI: A Creative New World》的文章,这会代表新一轮Paradigm shift(范式转移)的开始吗?
让我们一同来看看这篇文章吧,原文作者是红杉的两位合资人:Sonya Huang和Pat Grady,故意思的是在文章作者一栏,赫然还写着GPT-3的大名,并且文章插图也是用Midjourney天生的,这篇文章本身便是AIGC的一个落地表现。以下是原文的翻译,希望可以给大家带来新的创造和思考。
人类善于剖析事物,而机器在这方面乃至做得就更好了。机器可以剖析一组数据,并在个中找到许多用例(use case)的模式,无论是敲诈还是垃圾邮件检测,预测你的发货韶光或预测该给你看哪个TikTok视频,它们在这些任务中变得越来越聪明。这被称为“剖析型AI(Analytical AI)”,或传统AI。

但是人类不仅善于剖析事物,我们也善于创造。我们写诗,设计产品,制作游戏,编写代码。直到最近,机器还没有机会在创造性事情上与人类竞争——它们被降格为只做剖析和机器性的认知事情。但最近,机器开始考试测验创造故意义和俏丽的东西,这个新种别被称为“天生式AI(Generative AI)”,这意味着机器正在天生新的东西,而不是剖析已经存在的东西。
天生式AI正在变得不仅更快、更便宜,而且在某些情形下比人类创造的更好。从社交媒体到游戏,从广告到建筑,从编程到平面设计,从产品设计到法律,从市场营销到发卖,每一个原来须要人类创作的行业都等待着被机器重新创造。某些功能可能完备被天生式AI取代,而其他功能则更有可能在人与机器之间紧密迭代的创作周期中发达发展。但天生式AI该当在广泛的终端市场上解锁更好、更快、更便宜的创作。人们期待的梦想是:天生式AI将创造和知识事情的边际本钱降至零,产生巨大的劳动生产率和经济代价,以及相应的市值。
天生式AI可以处理的领域包括了知识事情和创造性事情,而这涉及到数十亿的人工劳动力。天生式AI可以使这些人工的效率和创造力至少提高10%,它们不仅变得更快和更高效,而且比以前更有能力。因此,天生式AI有潜力产生数万亿美元的经济代价。
01 为什么是现在?
天生式AI与更广泛的AI有着相同的“为什么是现在(Why now)”的缘故原由:更好的模型,更多的数据,更多的算力。这个类别的变革速率比我们所能捕捉到的要快,但我们有必要在大背景下回顾一下最近的历史。
第1波浪潮:小模型(small models)占主导地位(2015年前)
小模型在理解措辞方面被认为是“最前辈的”。这些小模型善于于剖析任务,可以用于从交货韶光预测到敲诈分类等事情。但是,对付通用天生任务,它们的表达能力不足。天生人类级别的写作或代码仍旧是一个白日梦。
第2波浪潮:规模竞赛(2015年-至今)
Google Research的一篇里程碑式的论文(Attention is All You Need https://arxiv.org/abs/1706.03762)描述了一种用于自然措辞理解的新的神经网络架构,称为transformer,它可以天生高质量的措辞模型,同时具有更强的并行性,须要的演习韶光更少。这些模型是大略的学习者,可以相对随意马虎地针对特定领域进行定制。
果不其然,随着模型越来越大,它们开始可以输出达到人类水平的结果,然后是超人的结果。从2015年到2020年,用于演习这些模型的打算量增加了6个数量级,其结果在书写、语音、图像识别、阅读和措辞理解方面超过了人类的表现水平。OpenAI的GPT-3表现尤其突出:该模型的性能比GPT-2有了巨大的飞跃,并且从代码天生到笑话编写的任务中都供应了出色的Twitter demo来证明。
只管所有的根本研究都取得了进展,但这些模型并不普遍。它们弘大且难以运行(须要特殊的GPU配置),不能被更多人广泛触达利用(不可用或只进行封闭测试),而且作为云做事利用本钱昂贵。只管存在这些限定,最早的天生式AI运用程序也已经开始进入竞争。
第3波浪潮:更好、更快和更便宜(2022+)
算力变得更便宜,新技能,如扩散模型(diffusion models),降落了演习和运行所需的本钱。研究职员连续开拓更好的算法和更大的模型。开拓职员的访问权限从封闭测试扩展到开放测试,或者在某些情形下扩展到开源。
对付那些渴望打仗LLMs(Large Language Model 大措辞模型)的开拓职员来说,探索和运用开拓的闸门现在已经打开,运用开始大量呈现。
第4波浪潮:杀手级运用涌现(现在)
随着平台层的稳固,模型连续变得更好、更快和更便宜,模型的获取趋于免费和开源,运用层的创造力已经成熟。
正如移动设备通过GPS、摄像头和网络连接等新功能开释了新类型的运用程序一样,我们估量这些大型模型将激发生成式AI运用程序的新浪潮。就像十年前移动互联网的拐点被一些杀手级运用打开了市场一样,我们估量天生式AI的杀手级运用程序也会涌现,比赛开始了。
02 市场格局
下面是一个示意图,解释了为每个种别供应动力的平台层,以及将在其上构建的潜在运用程序类型。
1. 模型
文本(Text)是最前辈的领域,然而,自然措辞很难被精确利用并且质量很主要。如今,这些模型在一样平常的中短篇形式的写作中相称出色(但即便如此,它们常日用于迭代或初稿)。随着韶光的推移,模型变得越来越好,我们该当期望看到更高质量的输出、更长形式的内容和更好的垂直领域深度。
代码天生(Code generation)可能会在短期内对开拓职员的生产力产生很大的影响,正如GitHub CoPilot所表现的那样。此外,代码天生还将使非开拓职员更随意马虎创造性地利用代码。
图片(Images)是最近才涌现的征象,但它们已经像病毒一样传播开来。在Twitter上分享天生的图片比文本有趣得多!
我们正在看到具有不同美学风格的图像模型和用于编辑和修正天生图像的不同技能在陆续涌现。
语音合成(Speech synthesis)已经涌现一段韶光了,但消费者和企业运用才刚刚起步。对付像电影和播客这样的高端运用程序来说,听起来不机器的,具有人类质量的语音是相称高的门槛。但就像图像一样,本日的模型为进一步优化或实现运用的终极输出供应了一个出发点。
视频和3D模型则远远掉队,人们对这些模型的潜力感到愉快,由于它们可以打开电影、游戏、虚拟现实、建筑和实物产品设计等大型创意市场。我们该当期待在未来1-2年内看到根本的3D和视频模型的涌现。
还有很多其他领域,比如从音频和音乐到生物和化学等等,都在进行根本模型的研发。下面这张图是基本模型进展和干系运用程序成为可能的韶光表,个中2025年及往后的部分只是一个预测。
2. 运用程序
以下是一些让我们感到愉快的运用,这仅仅只是一部分,实际上的运用要比我们所捕捉到的多得多,我们被创始人和开拓职员所梦想的创造性运用程序所吸引。
文案(Copywriting):越来越多的人须要个性化的网页和电子邮件内容来推动发卖和营销策略以及客户支持,这是措辞模型的完美运用。这些文案每每形式大略,并且都有固定的模版,加上这些团队的韶光和本钱压力,该当会大大推动对自动化和增强办理方案的需求。
垂直行业的写作助手(Vertical specific writing assistants):现在大多数写作助手都是通用型的,我们相信为特定的终端市场构建更好的天生式运用程序有着巨大机会,比如从法律条约编写到剧本编写。这里的产品差异化表示在针对特定事情流的模型和UX交互的微调。
代码天生(Code generation):当前的运用程序推动了开拓职员的发展,使他们的事情效率大大提高。在安装了Copilot的项目中,它天生了近40%的代码。但更大的机会可能是为C端消费者赋能编程开拓能力,学习提示(learning to prompt)可能会成为终极的高等编程措辞。
艺术天生(Art generation):全体艺术史和盛行文化的天下现在都被编码进了这些大型模型中,这将许可任何人随意探索在以前可能须要花人一辈子的韶光才能节制的主题和风格。
游戏(Gaming):在这方面的梦想是利用自然措辞创建繁芜的场景或可操纵的模型,这个终极状态可能还有很长一段路要走,但在短期内有更直接的选择,如天生纹理和天空盒艺术(skybox art)。
媒体/广告(Media/Advertising):想象一下自动化代理事情的潜力,为消费者实时优化广告文案和创意。多模态天生的绝佳机会是将发卖信息与互补的视觉效果结合起来。
设计(Design):设计数字和实物产品的原型是一个劳动密集型的迭代过程,AI根据粗略的草图和提示来制作高保真的效果图已经成为现实。随着3D模型的涌现,天生设计的过程将从制造和生产延伸到实物,你的下一个iPhone APP或运动鞋可能是由机器设计的。
社交媒体和数字社区(Social media and digital communities):是否存在利用天生工具表达自我的新办法?随着Midjourney等新运用学会了像人类一样在社交网络上创作,这将创造新的社交体验。
03 天生式AI运用的解析
天生式AI运用程序会是什么样子?以下是一些预测:
1. 智能和模型微调
天生式AI运用是建立在GPT-3或Stable Diffusion等大型模型之上的,随着这些运用得到更多的用户数据,它们可以对模型进行微调,一方面针对特定的问题空间改进模型质量和性能,其余一方面减少模型的大小和本钱。
我们可以把天生式AI运用看作一个UI层和位于大型通用模型“大大脑(big brain)”之上的“小大脑(little brain)”。
2. 形成的成分
如今,天生式AI运用在很大程度上以插件的形式存在于现有的软件生态系统中。比如代码天生在你的IDE中,图像天生在Figma或Photoshop中,乃至Discord机器人也是将天生AI放在数字社交社区里的工具。
还有少量独立的天生式AI Web运用,如在文案方面有Jasper和Copy.ai,在视频剪辑方面有Runway,在做条记方面有Mem。
插件的形式可能是天生式AI运用在早期比较好的切入点,它可以战胜用户数据和模型质量方面面临的“先有鸡还是先有蛋”的问题(这里详细指的是:一方面须要分发来得到足够多的利用数据,从而来改进模型,其余一方面又须要好的模型来吸引用户)。我们已经看到这种策略在其他市场种别中取得了成功,如消费者和社交市场。
3. 交互范式
如今,大多数天生式AI演示都是“一次性”的:你供应一个输入,机器吐出一个输出,你可以保留它或扔掉它,然后再试一次。未来,模型将会支持迭代,你可以利用输出来修正、调度、升级和天生变革。
如今,天生式AI输出被用作原型或初稿。运用程序非常善于抛出多个不同的想法,以使创作过程连续(比如一个logo或建筑设计的不同选项),它们也非常善于给出初稿,但须要用户终极润色来定稿(比如博客帖子或代码自动完成)。随着模型变得越来越智能,同时部分借助于用户数据,我们该当期待这些草稿会变得越来越好,直到它们足够好,可以用作终极产品。
4. 持续的行业领导力
最好的天生式AI公司可以通过在用户粘性、数据和模型性能之间形成的飞轮来产生可持续的竞争上风。为了取得胜利,团队必须通过以下方法来实现这个飞轮:
拥有出色的用户粘性→将更多的用户粘性转化为更好的模型性能(及时改进、模型微调、把用户选择作为标记演习数据)→利用出色的模型性能来推动更多的用户增长和留存。
他们可能会专注于特定的领域(如代码、设计和游戏),而不是试图办理所有人的问题。他们可能首先将深度集成到现有的运用程序中,以便在此根本上利用和分发自己的程序,然后考试测验用AI原生事情流更换现有的运用程序。用精确的办法构建这些运用来积累用户和数据是须要韶光的,但我们相信最好的运用将会是持久的,并有机会变得弘大。
04 困难和风险
只管天生式AI具有巨大的潜力,但在商业模式和技能方面仍有许多问题须要办理。比如版权、信赖、安全和本钱等主要问题还亟待办理。
05 放开视野
天生式AI仍旧非常早期。平台层刚刚有转机,而运用层领域才刚刚起步。
须要明确的是,我们不须要利用大型措辞模型的天生式AI来编写托尔斯泰小说。这些模型现在已经足够好了,可以用来写博客文章的初稿,以及天生logo和产品界面的原型,这在中短期内将会创造大量的代价。
天生式AI运用的第一波浪潮类似于iPhone刚涌现时的移动运用处景——有些噱头但比较软弱,竞争差异化和商业模式不明确。然而,个中一些运用程序供应了一个有趣的视角,让我们可以一窥未来可能会发生什么。一旦你看到了机器可以产生繁芜的功能代码或精彩的图片,你就很难想象未来机器在我们的事情和创造中不再发挥浸染。
如果我们许可自己梦想几十年后,那么很随意马虎想象一个未来,天生式AI将深深融入我们的事情、创作和娱乐办法:备忘录可以自己写,3D打印任何你能想象的东西,从笔墨到皮克斯电影,像Roblox类似的游戏体验来快速创造出丰富的天下。虽然这些在本日看起来像是科幻小说,但科技进步的速率是惊人的。从眇小(narrow)的措辞模型到代码自动天生只用了几年韶光,如果我们连续沿着这个变革的速率,并遵照“大模型摩尔定律(Large Model Moore’s Law)”,那么这些遥不可及的场景就会变得触手可及。
以上便是来自美国红杉最新关于Generative AI的判断,读完之后给人的觉得是AIGC运用的发展跟之前移动互联网运用的发展是很相似的,很有可能这将是真正的新一代平台级的机会。
参考材料:https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/
原文作者:Sonya Huang&Pat Grady
原文标题:Generative AI: A Creative New World
作者:寻思圈;"大众年夜众号:寻思圈(ID:gh_352a572cf923)
原文链接:https://mp.weixin.qq.com/s/b9YQuzkPnX87K2yzB6bgng
本文由 @寻思圈 授权发布于大家都是产品经理,未经作者容许,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。