一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户
过去三个月,AIGC 和其背后的大模型浪潮席卷中文互联网,所有人都能享受到人工智能技术升级带来的便利。
在公司层面,拥有大模型技术和资源的头部企业获得了最多的关注,而大模型应用层的创业公司虽活跃,但存在感却并不高。
甚至随着 ChatGPT 相关功能插件的释放,没有直接参与大模型竞争的应用层企业都有可能被类似于 OpenAI 的企业的一个插件所 覆灭 。
那么,作为应用层的创业公司将如何在这种压力下,寻找到属于自己的创新空间、打造独特的业务模式呢?他们的创业价值又将如何得到社会和市场的认可?
围绕应用层创业公司如何通过链接大模型与客户发挥价值,一览科技联合创始人兼 CTO陈锡言在「量子位 · 视点」直播中分享了他的从业经验和观点。
大模型的出现拉齐了很多公司的 AI 水平,革了很多 AI 服务商的命,同时它又以极快的速度普及,可以称为史上增长最快的月活破亿的应用,颠覆了很多技术、业务和服务。
ChatGPT 开始免费之后,基于 OpenAI 生态的一些创业公司其实都是一脸懵。虽然 OpenAI 的 CEO 表示说 不会和客户产生竞争 , Jesper CEO 也说 更多大模型的出现,让公司已经摆脱了对 OpenAI 的单一依赖。 但这些解释的逻辑其实很无力。
ChatGPT 的出众之处,在于除了大模型本身以外,还有自然语言的交互模式,这是自命令行、图像化 UI 之后的最先进人机交互模式。GPT4 提供了通用人工智能的可能性,对话的人机交互形式配上 AGI 之后似乎变得无所不能。文心一言、通义千问等国产大模型也都是如此。
在文心一言发布会上,李彦宏曾提出了一个四层模型:芯片、框架、模型、应用。但是他只说了这四层模型,但是没有说这四层模型的关系究竟是金字塔形的,还是倒金字塔形、橄榄形、菱形或别的结构。
src=芯片,肯定是卡脖子的核心竞争力。框架,是大公司的游戏。模型的线 亿起步,而百度还说文心同时做了 10 个行业大模型。
应用层,现在看起来 ChatGPT、文心一言以及其他大模型的这种交互类应用都是 ToC 的,而且免费。大家都说要做 AI 大基座,要形成自己的应用生态。
如果 AI 大基座在模型关系里是底层(在地上),那么它对于应用层的创业者来说是一个平台。但如果 AI 大基座是顶部(在天上),留给应用层创业者的就会是阴影。
目前看起来,现在做大模型的 AI 大基座们都表现出了一个 我全要 的状态:说是大基座,实际上包含了全部的四层模型。
通用人工智能好像什么都可以做,让很多 SaaS 软件很懵,多年的积累在大模型面前可能变得一文不值。所有软件公司都面临一种情况:被迫拥抱 AI。
当 所有应用都值得用 AI 重做一遍 被提出来之后,大模型先把自己母公司各系产品都加上 Copilot,比如浏览器、搜索引擎、即时通讯、办公软件等等。这真的让人很怀疑,我们还做其他软件的价值究竟是什么。
我认为能够被简单且精准描述 input、process 和 output 的工作更容易被取缔。
例如把图像中所有蓝色改成红色、仅仅做排版的文字编辑、按标准文档回复的客服服务,甚至说当制作一杯咖啡,加多少豆、怎么研磨、加多少水多少奶都非常标准的情况下,口感与手工咖啡的可能差别并不大。
现在几乎所有的风头热度都在制作大模型的这些公司,包括创业明星系的、BAT 系的、名校系的。有一件事情可以肯定,创业公司根本就参与不了大模型的开发工作。
A100 虽然不好买,但其实购买方法也很多,京东上就有——只不过上次查的时候是 10 万元一张,今天已经变成了 119,999 元。买不买得到并不是问题,买不买得起才是问题。
即使创业公司有 5,000 万,买完 500 张后连网线都买不起,电费也只能用花呗。所以创业公司入局大模型如果没有 10 个亿,根本上不了牌桌。
src=AIGC 并没有创造新的需求。我要一幅 AIGC 的画,可能等于我要一幅更便宜的画,这是供需市场决定的。AIGC 只是一个工具,而需求侧永远想要更便宜的产品。
AIGC 重复了很多业务流程以及供求关系,几乎所有的企业其实都希望 AIGC 来提升生产力,但实际上其实困难重重。
AIGC 工具强调个体,个体是打工人,打工人卖的是时间,凑够时间可能就拿到工资了。而 AI 工具作为新事物,还有很多的不确定性,很难说服打工人为了一个不确定的工具去增加学习成本。
很多 ToB 业务一旦成熟之后,商务关系往往比业务本身更重要。系统被弱化了,甚至有些老板对技术部的要求就是,只要不宕机,做成什么样都不影响公司赚钱。我听到最无力反驳的一句话,客户的工作方式不变,自己公司单独变化有什么用。
我们不得不承认,很多场景尤其是创意类工作场景,使用 AI 并不是一个很体面的事情。如果借助 AI 制作了东西,或是使用 AIGC 节省出了更多时间来休息摸鱼,打工人自然不想承认,也永远不能承认。
AIGC 工具现在更多的是个体的赋能,而不是对企业的赋能。希望大家记住这句话,这是我们创业的一个机会。
比如:一个计算机只能执行「+1」和「X2」两个运算,如果输入「1」,问最少几个步骤可以得到 63。GPT4 肯定是倒推法,方法是正确的,但每次都会算错一览科技CTO陈锡言:大模型阴影下,比较好笑的是它知道算错了,还能拼命扯回来。比如在某一步骤中「X2」,然后得到 70,突然发现超了,这时他告诉你最后再减 7,也能得到 63。
我不觉得稳定和精准是一个大模型应该有的必要属性,我也不相信语言模型能解决数学问题。这是我的一个比较偏执的世界观,有可能是错的。
大家有没有注意到,书法作为我们国家很重要的一种艺术形式,到现在为止却没有一个书法的 AI 模型出现。这可能是价值问题导致的,书法 AI 模型它可能就没有价值。
比如说这个字是启功写的,这字是苏轼写的,如果第三种字是 AIGC 写的,很有可能会被扔掉。因为书法很强调个人风格、审美和个人 IP。
理发师这样的职业是需要极其信任和安全的,如果一个黑化的理发师拿着刀在我面前,我可以说大哥别伤害我,打感情牌可能还有一线生机。但如果对面是一个机器人,它仅仅是一个杀戮机器,我毫无办法。
大模型本身的泛化能力仍然受限于数据集。如果说某个行业会被取缔的话,那最简单的一个判定标准就是该行业能否组织足够多、足够好的标注数据;如果数据质量非常多非常好,大概率机器会代替人完成。
但如果是那种不容易被标注的,比如说一个艺术作品,它不仅包含了创作者的情绪和感情,还包含了观看者当下的情绪,大概率不会被替代。就像我们常说的 1000 个人心中有 1000 个哈姆雷特 ,这个复杂度很难得到有效标注,标注的意义也不大。
我认为在科学面前,AIGC 和圣经是一样的,不是因为他们权威,而是因为在科学面前,他们都需要被摒弃。
AI 虽然可以处理和模拟一些既定的任务,但它们缺乏人类的直觉、情感以及对抽象概念的理解,这是无法模拟的。
我们有个客户是影视行业的上市公司,老板最开始要求全公司都要用 AI,100 多号人响应号召使用一堆五花八门的工具,后来缩减到只剩 ChatGPT 和 Midjourney,到最后就什么都不用了。直到后来找到我们来提供企业级的 AI 工具,和现有的工作流做无缝打通。
所以其实企业永远需要信息系统,如果又懂业务又懂技术的话,做大模型和企业之间的链接者是一个不错的选择。
AIGC 对于内容创作者,其实是一个特别好的时代。以前很庞大的创作组织,现在可能只需要几个人。
另外,ChatGPT 一本正经的胡说八道,或是天马行空的奇思妙想,这种能力特别适合做内容创作。
当我第一次看到 MaaS,也就是 Model as a Service 的时候,我是绝望的,要被大公司逼近绝路的感觉。但是最近我又看到一个词 Fine Tuning as a Service,我觉得特别有趣,一看就是程序员想到的。这个词让我感受到了程序员乐观、积极向上的情绪。
其实淘金热中最赚钱的是卖牛仔裤的。在整个 AIGC 大背景下,除了刚才那些直接创业的机会,我认为还会有一些炙手可热的工作岗位或是可以形成服务的。
随着 AI 工具的不断发展, AI 如何与人类的价值观保持一致,以及 AI 系统如何保证自己的可解释性等等将会成为重点。AI 对齐工程师,是要保证 AI 系统在任何时候都能和人类的价值观保持一致,保证人类的利益,以及保证人类对 AI 的控制权,甚至必要的时候拔网线、断电等等。
刚才说到每个企业都值得拥有自己的模型,那么在大模型基础上,通过微调或者蒸馏等方式,得到一个企业专有的模型,也是一个很重要的事情。
数据治理指的是在一个组织内部对数据质量、数据整合、数据隐私、业务流程等做合理的管理体,保证数据的准确性、一致性以及可用性。首先要数据可用,才有机会训练模型。
大多数企业的数据化程度是不足的。其实越是在线化业务的公司,或者做数据服务的公司,数据化程度越偏低,很多互联网企业的数据化程度甚至远不如一些工厂。
高质量的标注数据会成为 AI 系统的核心竞争力。前几天我看新闻,北京还提出了一个概念,要做统一的数据标注服务,大家也都看到了数据标注是一个非常重要的业务。
src=前段时间 babyAGI 和 autoGPT 比较火,火得快,凉的也快,但是留下了几个词很有价值,比如「思维链」和「任务队列」,有的地方解释成「工作流」。
左图是 babyAGI 第二版的工作流程图,核心就是把第一个问题形成一个问题列表,然后放到队列里面,对每一个问题做相应地执行,然后通过 ChatGPT 解读相应的答案,再对答案生成若干个问题,类似于金字塔的结构,通过逻辑树的方式逐渐地去找解决方案的本质。
右图指的是 autoGPT 第一版里面最重要的几步,也是把一个问题拆解成多步,然后列出相应的计划,但是它比 babyAGI 多了一步,就是检查这个东西对不对的概念,然后批评、反省。这个步骤对一个智能型的 AI 系统而言,是非常重要的。
从这两个开源项目里面,我们能学到很多做大模型还没有触及到的,或是比较有特色的 AI 系统的地方。我的想法是对它们做改进之后,使用专家系统来设置自己的业务工作流,提前录入到系统里面。
一览科技凭什么在应用层做 AI 视频工具,或者说在应用层 AI 这个产品上,我们具有什么样的优势?
src=第一个优势,数据积累。一览已经做了很多年的商用视频,服务了数千家企业用户,全球范围签约了数十万的视频创作者,积累了很多的商业视频数据,这些数据是独有的,且在创作以及视频交易的过程中,还会不断产生新的数据,具有成长性。
第四个优势,创作的安全性。通用人工智能 AGI 有很多的风险及不确定性,但在内容创作上的包容度以及 AI 对齐和内容安全措施已经相对完善,涉政、涉恐、涉黄、涉暴的预警措施相对完善。
我们选择了一个适合自己的垂直的领域,并且在这个领域上具有一定的优势,这是一览 AI 视频工具在应用层的特色。
我们提前把工作流注入到 AI 系统里,然后由 AI 一步步执行。在我看来,Step by Step 这个过程并不应该由通用人工智能来执行,应该由人类专家来输入。
src=第一步,通过一句话生成若干个创意。生成创意的过程,等于头脑风暴,这特别适合 AIGC。我们可以输入几个关键词,比如宫廷、狗血、爱情、伦理、逆袭、反转,它就能够瞬间输出很多个创意。
第二步,在工作流程之中开始角色设计。角色设计需要哪些东西,比如人物的性格特征,行为习惯,体貌特征,对话风格,包括性别、年龄等。
src=现在有了角色和创意,把这些内容输入给 AI 来生成剧情,剧情里面一定要有冲突和反转,这也是我们要提前录入进去的设置,然后就可以快速生成若干个剧情,同时批量生成几百字甚至几千字的脚本。我们可以选择 1 个最有挑战的剧情,接下来根据剧情,我们还可以生成一系列概念图。
另外,大家也知道 Token 的限制,其实对于剧情,我们也可以把一个剧情分解成若干个段落,每个段落再进行扩展,这也是一个能让剧本逐渐丰满的过程。
评估反馈,大家可以理解为剧本评分,相当于 autoGPT 里面的批评环节。这个过程中,我们可以产生更多的信息、更多的数据。
src=经过剧本评估之后,这些情节段落进行不停的调整和优化,然后进入下一步,再次生成视觉化的创作,不断打磨作品质量。
AIGC 可以提高所有生产工作或者创作的平均水平,但是它只能让未来比过去更好。但如果以前都变得一样好时,原来的更好就变成了现在的平庸。当 AI 工具全面普及,平庸的创作会无比廉价,人类的未来属于真正的工匠的技术创业机会——链接大模型与用户。
src=毋庸置疑,AI 工具普及和 AIGC 内容爆炸都是历史浪潮的一部分,不可倒退,无法避免。从媒体到时尚到建筑,再到其他一切,都会充满了不可避免的、普遍的平庸。但乐观的人总能找到自己的方式翻出不一样的浪花。最后用马斯克最近发的一个推特献给大家。
量子位发起的 CEO/CTO 系列分享活动,不定期邀请前沿科技领域创业公司 CEO/CTO,分享企业最新战略、最新技术、最新产品,与广大从业者、爱好者探讨前沿技术理论与产业实践。欢迎大家多多关注 ~