上海有位李博士,提出了相声笑果预期总公式,又因为在东方台面授郭德纲一炮而红。且不论公式是否靠谱,这个人倒是真的让大家笑了:相声还能用公式算,你开什么玩笑?

最近,我也碰上了这样的事儿。这学期,我在中国传媒大学开了门《计算广告》,本以为大家会踊跃讨论算法和数据,谁知一上讲台,中传的老师就提醒我:恐怕你得先说说,为什么广告还要计算呢?

广告为什么要计算?!这对互联网人来说,似乎与“洗澡为什么要脱衣服”一样,从来不曾被问起,永远也不用回答。面对如此深邃的哲学诘问,我陷入了沉思,醒来时顿然领悟:原来在不同背景的广告从业者之间,存在着巨大的认知鸿沟。

对传统广告的学者、代理公司和CMO们来说:广告是在戛纳落日的余晖里,用香车美女围绕着甲方爸爸,靠想象力和洞察力,忽悠全世界用户以买单为荣,是街边的破烂小店和黑手黑脚的码农不能觊觎的。

对互联网的工程师、产品经理和CGO们来说:广告是驱动新时代财富引擎的黑科技,靠人工智能平地抠饼一样哗哗印着钞票,还别说艺术工作者,凡高数成绩八十分以下的从业者,都应该羞愧得无地自容。

为了抹平这一鸿沟,争取诺贝尔和平奖,我决定通过本文,把“广告为什么要计算”这个问题,做一番提纲挈领的解释。如果本文你都理解了,那么你对数字广告原理的把握,应该超过90%的广告公司CEO了。

传统广告把广告活动的执行流程,分为策划、创意、投放和结案几个部分,譬如下面特洛伊木马的头尾身足。只是“投放”这个马身子,因为传统媒体既无法归因,也无法个性化,只好当个黑盒子不求甚解。

有了数字媒体,木马的腹内玄机才为人注意:如何在每次展示时,通过计算选出最优的个性化广告,以显著提高效果,是新的革命性问题。于是,在互联网广告圈,大家开始把目光聚焦在木马的身体内部。

个性化,就是看人下菜碟,即根据用户决定投什么广告。这早已是个老生常谈的口水概念了,但要提醒大家,个性化的基本原则与其说是“合适者得”,不如说是“价高者得”,这也是我们将要讨论的核心计算问题。

b8389b504fc2d562cc89327eaf548eea77c66c6e

从商业上看,个性化首先能让用户看到更感兴趣的产品推广,大大提高转化率;其次可以精细地切分流量,以同时服务大量小客户。这些给市场带来了什么变化呢?

最重要的变化,就是媒体不再跟大客户们讨价还价,逮住蛤蟆攥出尿来,而是泰山不让土壤,尽量降低客户的进入门槛,让他们自主出价,再根据价高者得的逻辑来分配流量。

也就是说,在线广告的售卖模式,由谈判达成合同为主,变成了开放式竞价为主,这一点至关重要。

在这样的商业逻辑下,广告平台的核心目标不再是预算,而是客户数!客户数!客户数!

这很好理解:客户足够多,就能把价格抬到较高的水平上,媒体就能躺着挣钱了。您想想各大售楼处开盘的时候,为什么要花钱雇大妈们排队,就能对此有直观认识。

结果,与传统广告相比,数字广告市场结构发生了巨变:2019年1月,Facebook的广告客户达到了七百万!这比互联网产生前,人类历史上的广告主总量恐怕还要大一个量级。另外,收入也大半来自效果客户的蚂蚁雄兵,大品牌客户的预算和话语权早已是明日黄花。

屡有传统大企业CMO问我,如何拥抱数字广告?依我看,最重要的是先理解这样的市场变化:时代变了,小客户才是市场主宰,媒体再不会屁颠屁颠地围着你们转了!没错,人家还对你远接高迎四菜一汤,但那不过是拿你当个幌子,给小客户们看看罢了!

下面我们就来看看,价高者得的拍卖模式中的基本计算逻辑是怎么样的?

一、基本计算逻辑与分工

什么是价高者?就是给本次展示带来的最大收益的那则广告。因为要在广告投出去前的一瞬间做决策,这个展示收益是预估的,叫“千次展示期望收益(expected Cost per Mille, eCPM)”,由于单次展示收益太小,为了方便,习惯上乘个一千。我们说计算广告,核心就是算这个eCPM,找出价高者。

eCPM具体怎么算呢?我们把广告产生效果的过程分解,就清楚了。

如下图所示,一部分用户看到广告后会点击它,这个比例是点击率μ;而点击用户又可能产生转化,为客户带来平均点击收益v。显然,只要分别算出这两个量,把它们乘起来就是eCPM。

8601a18b87d6277f8d8d9b1e617d0135e824fcc7

分别估计,那么由谁来估计呢?

一般来说,由于点击数据在媒体上,转化数据在客户那儿,因此媒体估计点击率,客户估计点击收益,是最合理的分工。

相应地,我们看到的主流计算广告平台,很多都是按点击收费(Cost per Click, CPC)的。

5ab5c9ea15ce36d30c88ac2072b62482e850b1d8

这里有个新的疑问,客户与媒体是博弈关系,他们没有义务上报真实的点击收益,而是怎么有利就怎么出价。问题来了:如何引导客户,让他们尽量说真话呢?否则,乘起来算出的eCPM就不对了啊!

这个问题,在博弈论中早有答案:如果拍卖采用二价,也就是向拔头筹者按第二名出价收费,那么在达到纳什均衡状态时,竞拍者就会如实按自己收益出价,否则就对自己不利。

如果有一组位置一起拍卖,二价可以推广为更一般的VCG定价,细节就不赘述了。二价和VCG机制,是维护竞价广告系统稳定透明,最大化社会价值的定海神针。

客户给了点击收益,该算点击率了。某次广告展示的点击率,跟什么因素有关呢?

一是用户,不同用户的兴趣与需求不同,适合的广告也不同;

二是场景,也就是用户当下正在做什么,毫不相干的广告效果自然不好。也就是说,点击率是广告、用户和场景三者的函数。

38dbb6fd5266d0163989ecd8df6eca0234fa3573

上式里的用户(u)和场景(c)两个因素,仅知道其ID是没什么用的:你要的不是他叫张三,而是他对什么有兴趣。于是,定量描述用户和场景的特征,就催生了另一个计算问题——受众定向,或者叫用户画像,这就得有些用户数据才能做了。

受众定向,就是根据用户在各种场景的行为数据,推算出他有什么兴趣,强度如何。仅仅依靠广告系统本身产生的数据,是不足以有效刻画用户的,我们往往需要有搜索、购物、应用列表等更有价值的数据资产。有了用户的兴趣标签,就可以带入到点击率模型中,更准确地判定他对某个广告的反馈了。

当然,这也带来了严重的问题——对用户数据的肆意收集和滥用。

数据创造了互联网的繁荣,也带来了对用户隐私的威胁。如何加工数据,在个性化结果和用户隐私之间找到技术性平衡,这个课题称为差分隐私(Differential Privacy)。不过,个人认为,像欧盟那样不分青红皂白的GDPR标准,是因噎废食的,如果真的严格推行,将彻底摧毁欧洲的互联网产业。

至此,我们搞清了计算广告的典型决策逻辑:根据当前用户和场景,算出每个候选广告的eCPM,选最高的展示。其中,媒体根据给用户标签计算点击率,再跟客户出的点击收益相乘,即得到eCPM。另外,为了激励客户真实出价,还要采用二价或VCG机制。

除了这种典型逻辑,还有两个产品趋势:一是需求方的计算向下游扩张,是为程序化;二是供给方的计算向上游扩张,是为oCPM/CPA。

二、向客户开放计算:程序化

如果把广告决策向客户进一步开放,他们就可以用自己的数据和算法了。比如,客户对自己的会员特别了解,能更准确算出这些人的点击率和点击收益,那就干脆都交给客户算,然后把eCPM报给媒体就是了。

别忘了,每次展示都要做广告决策,因此客户必须架起服务器,用程序代替人做投放,这就是程序化广告。由于eCPM的估算都由客户完成,程序化广告一般是按CPM结算的。

b151f8198618367a47ee40ca663695d1b31ce508

程序化方向的拥趸,以Google为代表,他们全系列的程序化产品线,为其他大型媒体广为效法。而京东、头条这类数据资产丰沛,技术能力上乘的大客户,用程序化方式接入媒体平台采买流量,也已经是标准方式。可以说,程序化广告的繁荣,极大地推动了第一方(客户)和第三方数据的使用与交易。

然而,程序化广告有个天然的问题,那就是大客户才玩得起,这与前文客户数至上的原则是南辕北辙的。可以想见,这扩大了大客户的竞争优势,但是对客户数的帮助很小,因此媒体并不见得多受益。

大家可以想想,为什么搜索广告没有程序化?明白了这点,就会对程序化的优缺点了然于胸。当然,在国内,像搜索这样需要客户手工投放的,只要后台是竞价的,也被很多人庸俗化地称为程序化广告。这样的说法,是完全错误的,应该扒了袜子左右开弓给他一千四百个大嘴巴。

三、全部由媒体计算:oCPM/CPA

与开放的思路相反,也可以把点击率和点击收益的计算都交给媒体,直接按转化(Cost per Action, CPA)或销售(Cost per Sale, CPS)跟客户结算。实际上,拥有流量和数据霸权的媒体寡头,很有可能在点击收益的预估上也比客户做得要好——前提是客户把转化数据提供给媒体。

d53f8794a4c27d1e9dcf131d5390b36bdfc438c3

这种较封闭的产品思路,以Facebook为代表:他们没有向客户开放程序化接口,而是希望连点击收益的计算也接管。别忘了,Facebook有用户丰富的行为和兴趣信息,要没客户算得准才奇怪。

问题是转化的过程五花八门,并不太可控。比如,你的网站老宕机,我怎么按效果跟你结算?对此,Facebook创造性地采用了oCPM(optimized CPM)方案:按CPM结算,但是按CPA优化。当确信数据可行后,就彻底接管变成CPA。

中小客户对这样的方案是翘首以盼的,因为再不用优化广告投放,设定目标守株待兔就好了。至于oCPM付出的测试成本,那是有限和可控的。因此,在oCPM/CPA产品机制下,小客户进入市场的成本降到了极低的水平。

最后的话

讲一些事后诸葛亮的话:

后一个产品方向似乎更成功,它也更符合我们客户数优先的理念。从结果上看,Facebook的客户量发生了井喷,后来居上超过了Google,当然,产品差别并不是其中唯一的决定因素。另外,这两个产品方向也并不矛盾,可以在不同的客群上分别采用。

特洛伊木马肚子里藏着的秘密,概要就是如此。希望本文成为您快速理解现代在线广告“计算”奥秘的棒喝之道。这么没辙又没哏的内容,再写下去读者该骂街了,我们就此打住。