2022年5月27日,有AI四小龙之称的云从科技登陆科创板,首日定价15.37元,市值不足120亿元。遥想2020年5月,公司完成上市之前的最后一轮融资(pre-IPO轮),合计6亿元,彼时估值已经达到130亿元。上市价格低于pre-IPO价格,在A股非常罕见。

上市时距离上轮融资已过2年,公司发展和资本市场反馈均不及上一轮融资之时。云从科技一直未实现盈利。2019年-2021年,云从科技净利润分别为-6.92亿元、-8.44亿元、-6.64亿元。财务指标有两大特征:一是毛利率偏低,只有30%-40%;二是研发费用居高不下。

同为AI四小龙之一的商汤面临同样的盈利困境。2018年-2021年商汤合计亏损376.89亿元,同期营收合计仅130.26亿元,亏损接近营收的3倍。而且亏损额还在逐年加大。

2022年6月末一级市场投资人解禁,商汤科技日跌幅近47%。2021年12月上市时,商汤发行价3.85港元/股。上市半年,价格最低跌到2.38港元/股。

2022年之前,国内资本市场普遍看好一个方向:新技术改造传统产业,实现国际竞争中弯道超车。其中,人工智能替代人力投入的技术特征,契合了中国人口红利末期产业升级的需求。而且,谷歌的Alpha Go持续刷新围棋对战纪录,更让市场看到了人工智能的无穷潜力。这些都催生了国内人工智能的投资热潮。

2015年-2017年我国新成立的人工智能公司占到近十年注册量的50%,其中就包括大家耳熟能详的AI四小龙。另一方面融资规模也在逐年加大,2015年-2021年行业融资金额每年以翻倍的增速上升,单笔融资额也从2015年不足1亿元攀升都2021年接近3.5亿元。这直接体现了人工智能行业不断壮大、落地场景不断丰富的特征。但也从侧面反映出,行业发展依靠“烧钱”,自身造血能力弱。

人工智能行业2015年-2021年,合计融资超万亿元。虽然国家出台各类支持政策,但是行业依旧处在大面积亏损状态。一边是投资热潮、未来科技焦点,一边是企业亏损、从业人员焦虑。

这让我们不禁想要探求人工智能行业为什么亏损?这些企业是否真的能“烧”出一个未来?

成本端:成本刚性

人工智能企业为什么亏损?首先需要分析,为何相较一般软件行业,其毛利率较低。

开展一个人工智能项目,并非大家想象中从零开始搭建精密的算法模型。这样开发周期和成本均不能掌控。行业发展至今,已经形成了相对完备的模型库。业务开发人员只需抽取相关模型,用特定数据进行训练优化即可。

所以从开发阶段划分来看,人工智能项目大致可以划分为四个阶段:

1. 数据处理;

2. 模型设计及优化;

3. 模型评估及调整;

4. 实施部署。

各阶段的成本也呈现出不同特点。数据处理阶段主要为数据成本;模型设计及优化阶段主要为算法成本;最后两个阶段主要是交付成本。

(1)先看数据成本

数据处理环节内容较为庞杂,不仅包括原始数据获取或购买,还包括将数据整理成人工智能模型可识别的类型,甚至还要对数据进行裁剪、加粗等增强工作,形成适合的数据。

高质量的数据是算法模型成功的重要保障,但是数据处理并非一个技术问题。处理过程虽然简单,但往往是大量人力堆积的结果。数据标注行业,业已成为经济相对落后地区的重点发展产业。

自然语言处理(NLP)是一类让计算机理解人类语言,从而快速给出海量资料分析结果的人工智能基础技术。一个常见的NLP模型,训练数据样本量在5万-10万/标签,稍微复杂一些的模型,训练数据样本量要20万个。

文本数据标注还算简单,但是像人脸识别类模型,需要对图像数据进行标注。单个样本标注处理时间是文本数据3倍-5倍。训练一个人脸识别模型大概需要10万的样本量,数据整理标注成本较高。如果样本数据需要购买,整个数据成本要占到项目总成本的接近60%。从项目开发时间来看,数据采集、清洗、标注、增强等处理时间占到整个开发周期80%。

可惜的是,花费如此高的数据成本之后,所开发模型的通用性并不高。核心在于各场景下的数据标准很难统一。例如胡同交通和马路交通都并不一致,同样的识别模型在两个场景切换时就会产生巨大的效果差异。

而修改模型的成本不亚于重新开发一个模型。模型训练所需的数据质量要求高、通用性弱,造成了数据部分成本颇为刚性。

(2)再看算法成本

算法成本,即具体应用模型的设计及开发所产生的支出,主要体现在工程师的人力成本和模型训练所必须的硬件投入。

一般来看,一个市场定价在5万-10万元的常用算法模型项目,开发时间约为100小时,需要1个-2个算法工程师。单个算法工程师单月产能为8万-10万元。按照常用模型平均复用率3次(即同一个模型可以销售3次)来估算,其单月创收为20万-30万元。然而算法工程师当前薪酬5万-8万元/月,人力成本不可谓不高。这也难怪一些人工智能公司常常抱怨招不起人。

而且值得说明的是,人工智能当前依旧处在高速成长期,算法人才供不应求,用工成本不会大幅下降。

模型训练所需要硬件投入,相对数据、人力成本占比较低。而且作为固定资产,其复用率也高。其投入主要就是CPU和GPU。一块性能中等的CPU市场均价3000元左右,一般市场定价在5万-10万元的常用算力模型,大概需要4块-6块CPU。这方面投入额不到2万元,且各个项目通用性高,成本平摊之后相对较低。

(3)最后看看交付成本

交付成本指的是在模型验收和实施部署阶段,不能一次性成功交付,需要反复调整而产生的支出。当前国内一般项目一次性通过率不足60%。如果无法一次性成功交付,往往意味着需要补充数据和算法人员,甚至需要二次开发。这无疑会增加项目成本。

综合来看,一般人工智能项目的成本构成如下:数据成本占到60%,人力成本20%,硬件及后续调整20%。在各项成本中,人力成本因为供不应求及市场竞争原因,短期内不存在下降的可能。只要人工智能深度学习底层框架不变,数据成本就呈现绝对刚性。整体来看,成本可下降的空间有限。

收入端:单价难提,复用有限

既然成本端支出刚性,那么收入是否会有所改观,从而提升毛利率呢?从项目收入角度看,提高毛利率无非两条路径,一是提高项目单价。这除了和人工智能项目定价机制有关,也和采购客户自身预算约束相关;二是提高项目模型的复用率。即针对某一项目开发的模型,尽可能的多卖几家,摊薄模型开发成本。

项目单价方面。人工智能企业单一项目的报价方式普遍采用“成本加成”模式,一般在名义成本上加成20%-30%。实际上企业会虚报一点成本,这样毛利率就可以增加些许。但是在现实中,由于现阶段人工智能技术远没有达到高效替代人工的作用,采购客户往往是尝试性的消费。该种模式下,客户不接受人工智能企业过高的成本加成比例。这导致单价提升困难。

模型复用率方面。从人工智能公司客户分类的角度看,大致可以分为政府客户和一般企业客户。

政府项目完全基于特定算法模型,定制化程度高,基本不复用。该类项目受政府预算影响,并非商业化主流。企业客户才是人工智能规模化商用的目标,也是新技术助力传统产业升级的价值体现。

针对企业客户,人工智能企业的商业模式是,针对各类高度细分场景,开发通用型的算法模型,提供单次数据服务或者运营报告。

这类模式下,单次服务的市场报价一般保持在模型开发成本的15%-30%。如果企业项目毛利率要达到软件行业平均的50%-60%,算法模型复用率要达到6次-10次,且每次复用模型的二次开发或者调整成本较低。

如此高的复用率就要求模型所针对的细分行业内人工智能应用较为普遍,这类细分行业一般具备以下特点:

1. 主要为简单重复性工作;

2. 场景标准化程度高,数据差异小;

3. 依靠大量人力。

同时具备这三类特征的细分行业主要集中在工业生产领域。而且,具备高度自动化物理设备的环境,才能充分展现人工智能的价值。然而当前工业自动化水平不高,单独的人工智能技术难以施展威力。

能够具备以上三个特点的上游行业通常存在很强的规模效应,行业规模相对集中。例如视频监控领域。大规模视频监控产生了大量标准化的图像识别需求,过往需要大量人力进行筛查,人工智能的出现能够大幅提高效率。

智能分析企业相对视频监控企业集中度低,加之模型技术难度壁垒不高、竞争激烈,导致该类人工智能企业的市场话语权低。它们需要依附上游企业,盈利能力被压制。

综合来看,人工智能使用效果不显著,导致下游客户尝试型采购,项目单价难以提高。未来技术持续进步,项目单价可能带来提升。但是从模型复用率看,人工智能高度依赖数据训练,而下游各细分场景数据差异性大,导致模型普适性不高,单一模型复用率低,成本无法实现摊薄。

在当前技术阶段,项目单价不能快速提高的客观现实下,如何提高模型复用率成为人工智能企业盈利关键。

费用端:技术与资本合力推高

毛利率无法改善、收入难以提升、销售费用率难以降低,一般企业已经处在亏损边缘。而企业居高不下的研发费用更让这些企业雪上加霜。一般来说,当前行业普遍的研发费用达到销售收入的20%以上。

人工智能企业融资的用途一般在两项,一项是给即将交付的项目垫支,维持企业正常运行,另一项便是研发更高精度、适用场景更多的算法模型。

当前高比例的研发费用是技术博弈和现实融资要求共同作用的结果,企业很难削减该部分支出。

从技术上看,高额研发投入也是行业发展阶段的必需。现阶段人工智能面临各种各样的问题,归根到底还是技术水平不能满足商业需要。

高额研发费用的持续投入成为企业博弈未来的必经之路。作为典型技术驱动的行业,技术迭代快速,如果企业在技术上不能保持相对领先地位,很快便会失去现有市场地位。

从企业生存角度来看,在企业尚不能自身造血的情况下,生存基本依赖外部融资。如何证明技术先进性,成为人工智能企业必须向外部投资人回答的问题。

本来当前算法研发迫切需要解决模型复用率低的问题,但单个企业无法解决此问题。

所以实际情况下,企业将更多的研发费用花费在算法精度提升上,参加各类人工智能竞赛,博取名次。用比赛成绩以及高精度量化指标,向资本市场展示其技术水平和技术持续进化的潜力。

现阶段人工智能企业均配备高质量研发团队专门进行技术比赛,但是由于比赛场景和现实场景数据差异过大,其研发的模型与商业应用相去甚远。

人工智能企业的三种模式

当前算法模型对数据质量及数量高度依赖,导致数据获取及整理成本居高不下。再加上行业竞争加剧带来的人才抢夺在不断推高人力成本,成本较为刚性。

收入端因为人工智能技术的发展阶段尚不能实现对人力大量替代,实用性需求不足,项目单价提升困难。而细分场景数据差异性大,导致已开发模型复用率低。

这些原因导致人工智能行业毛利率远低于软件行业。另一方面受行业本身技术发展要求以及后续融资的考虑,企业又不得不保持较高的研发投入。种种原因导致了这个在中国发展近十年的行业,依旧普遍亏损。

在这种残酷现实条件下,人工智能行业大致分化成三类企业:

第一类企业专注于常用复用率较高的算法模型。这类项目所需技术简单,对准确率以及速度要求不高。企业往往针对某一个项目开发模型,并将其进行大规模复用。其盈利模式也从单纯的“项目制”一次性收费,转向“运营制”按次数收费(提供咨询报告模式)。

这类模式虽然实现自身造血,但是存在两个方面的问题。一方面是模型复用率虽然有所提升,但是因为现实环境下数据复用的场景不多,企业需要不断寻找细分落地场景。

另一方面是融资难,该类模式下所开发的模型均使用较为普遍型技术。在行业技术不断迭代的阶段,资本市场认可度差。这类企业为解决这个问题,往往会引入成建制的研发团队专门打比赛刷模型数据。这类企业依旧保持巨额的研发费用支出,容易产生亏损。

第二类企业专注在政府项目,这往往是人工智能产业头部企业。政府项目单价高,定制化程度也高,这些项目更偏向与行业内知名公司合作。

这种模式虽然有利于公司扩大行业影响力,项目利润率也高,但是缺点在于项目定制化程度高,所开发的模型基本不形成复用。

另外政府项目来源并不稳定,很考验企业渠道能力。近年来随着人工智能企业不断涌现,获取项目的竞争加剧。从企业经营来看,前端项目来源不稳定,后端人员成本支出刚性,再加上政府项目回款普遍较慢,企业需要大额流动资金。这类企业现金流会始终处在紧绷状态。

第三类企业专注视频图像分析领域。这是为数不多的场景高度重复且市场规模较大的细分领域。从商业模式上看,上游数据源源不断,算法模型可以实时训练。基于这些数据可以衍生很多服务项目,天然具备从单纯的项目制收费转向持续性运营收入。例如短视频领域的信息流推荐系统,推荐算法在短视频平台源源不断的数据中进行不断迭代,精准流量推送成为获取高额广告费用的保障,平台与算法实现了高度契合。

近年来人工智能的创业多聚焦于此。但是该行业用户的市场集中度高。监控视频领域海康威视(002415.SZ)和大华股份(002236.SZ)接近双寡头垄断;互联网领域也高度集中于少数几家巨头。这些企业把握核心数据流量,目前积极建立自己的人工智能团队,打造新的业绩增长点。第三方人工智能企业只能辅助应用开发,产业链话语权低。

结语

从2013年开始的人工智能投资热潮,持续至今已将近十年,行业依旧面临大额亏损。而且从已上市企业财务情况看,亏损逐年加大,生存高度依赖外部融资。

它们是否真的能够“烧”出一个未来呢?

我们认为人工智能当前尚处发展初期,技术、产品、商业化均面临重重矛盾。未来行业极有可能从基础技术底层框架角度进行变革,当前领先的人工智能企业亦面临技术迭代带来的行业洗牌风险。

当前企业毛利率偏低且无法改善,技术持续迭代导致高额研发投入无法消减,行业实现盈利尚需时日。