- 课时1 广告的目的
- 课时2 广告的有效性模型
- 课时3 广告与营销的差别
- 课时4 在线广告的特点
- 课时5 在线广告市场
- 课时6 计算广告核心问题和挑战
- 课时7 广告,搜索和推荐的比较
- 课时8 投资回报ROI分析
- 课时9 在线广告系统模块
课程地址:计算广告学
课时1 广告的目的
广告,推荐,搜索,这三个领域我们称为wide scale challenge(大规模数据挑战)。广告中文字推荐高于图片广告 但对于推荐系统图片广告高于文字广告
“广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。” —— 广告(Advertising)的定义来自于阿伦斯的《现代广告学》。
-
广告的主体:广告主(advertiser),媒介(medium),受众(audience)
-
本质:借助某种广泛受众的媒介的力量,完成较低成本的用户接触(reach)
品牌广告和效果广告
-
品牌广告(Brand Awareness):目的在于提升较长时期内的离线转换率。能够为企业长期带来利润空间。
-
效果广告(Direct Response):有短期内明确用户转化行为诉求的广告。
课时2 广告的有效性模型
-
曝光:它是指广告是否被用户所看到,它是由广告位的天然属性所决定,无法通过算法的方式进行优化。
-
关注(attention)是指用户在看到广告后,是否注意到这个广告。可通过算法优化
-
理解是指用户的确理解广告的内容
-
信息接受是指用户理解广告的内容,并认同广告中的内容。
-
保持是指在相当长的时间内,都能想起一个品牌,并可能购买这个品牌的商品。
-
购买的效果取决于是否在用户的价格敏感接受范围
对广告有两点基本的评价指标,点击率和后续的转化率。
课时3 广告与营销的差别
两者的区别是广告主要针对的是潜在用户,而销售是针对对商品有明确需求的人。
广告的目的是通过媒介传播企业形象或产品信息,而销售的目的是提升产品销量。 广告的效果是特定人群的有效reach,而销售的效果是收入和利润。
课时4 在线广告的特点
在线广告的特点
-
技术和计算导向: 在线广告和线下广告产品运行的形态有很大不同,在线广告一直在被技术和产品驱动,与之相对的线下广告是被创意和客户关系驱动。数字媒体的特点使在线广告可以进行精细的受众定向,即对不同的用户推荐不同的广告。技术使得广告决策和交易朝着计算驱动的方向发展,计算已经成为广告中主导的部分,而商业逻辑作为辅助的部分。
-
可衡量性:广告的点击是广告效果的直接收集途径,可以很直接地从点击率中看到广告的效果。
-
标准化:技术投放和精准定向促进了在线广告的标准化
课时5 在线广告市场
第三个阶段:Supply产生了广告交易的平台,就是AdExchange,Demand方对应产生了DSP(Demand Side Platform)。
Supply有三种技术变现的方式:
-
托管给Ad Network,比如,一个网站有一个广告位,它可以在AdSense里注册这个广告位,即托管给AdSense,AdSense的下游是Automated Trading Desk(ATD),ATD从多个AdExchange中买流量,并有优化ROI的功能。
-
托管给广告交易市场,即托管给AdExchange。比如google display network会将它竞价比较低的流量导给AdExchange,让AdExchange进行实时竞价,实时竞价的好处是一些小的流量可能会以比较高的价格卖出。AdExchange会接受DSP的出价,而DSP与Agency是一起的。
-
SSP(Supply Side Platform)。它产生的原因是AdSense这些网站是优化自己广告平台的营收,而不是网站的营收,而网站当然有优化自己营收的诉求,而SSP就是站到媒体的利益方来设计优化方案。
课时6 计算广告核心问题和挑战
公式中a表示Sponsor(advertiser),c表示媒体(context),u代表受众(user)。公式的含义是:给定user,给定context,选择一组ad,使得ROI最高。
从优化角度看它涉及:
-
特征提取:受众定向,即把u和c打上标签的过程。
-
微观优化:对一次展示进行优化,得到最好的广告,最关键的技术是CTR预测。
-
宏观优化:因为在线广告是用户,媒体,广告商三方博弈,所以竞价市场机制的设计非常重要。
-
受限优化:在量一定的情况下,怎么来优化质,在线分配就是这个问题。
-
强化学习:如何知道在新的广告主或新的用户群预测它的点击率,很直觉的想法是尝试,分配一定的流量给广告,看是男性用户点击率高还是女性。但是在尝试的过程中会损失一部分收入,因为不是按最优策略出广告的了。尝试的过程即探索,使用探索的结果即利用。
-
个性化重定向。
从系统角度涉及:
-
候选查询:要使用实时索引技术,使广告能很快地进入索引,很快指两个方面,新的广告要能尽快上线,广告预算用完的广告要尽快下线。
-
特征存储:在线高并发要用到一些No-Sql技术。
-
离线学习:很多时候要用到Hadoop。
-
在线学习:一些比较快的反馈,比如得到用户上一个搜索词,要用到流计算技术。
-
交易市场:要用到实时竞价。
在线广告计算的主要挑战有:
-
大规模(Scale):线投放系统中的高并发挑战 (例: Rightmedia每天处理百亿次广告交易,它会向多个DSP去请求,即每天要进行千亿次的请求),响应速度在常见的web应用中可能是最高的。
-
动态性(Dynamics):需要所建立的模型支持快速变化,比如涉及到CTR预测,那么模型参数是否能快变,特征是否能快速改变都是有挑战的。
-
丰富的查询信息 (Rich query)
-
探索与发现 (Explore & exploit):用户反馈数据局限于在以往投放中出现过的(a, u, c)组合,需要主动探索未观察到的领域,以提高模型正确性。
课时7 广告,搜索和推荐的比较
广告明显比搜索容易部分的是不需要复杂的爬虫技术和PageRank。而它比搜索困难的地方是它需要建模的数据量比搜索要大。搜索,广告与推荐三者的主要区别在于它们的准则不同,搜索主要是针对相关性,广告主要针对ROI。
推荐和广告比较大的区别是:推荐进行的是同质化的推荐,另外推荐还有优化流(downstream)的概念,比如用户在看新闻时,会根据推荐跳到另一个新闻页面,而在这个新闻页面上可以继续推荐,优化流是指优化整个根据推荐看新闻过程的点击率。而对于广告来讲,推荐出的广告点击后,就跳到目标页面了,就不可能有优化downstream的机会了。
课时8 投资回报ROI分析
点击率(CTR),点击率是用户(u),广告(a),上下文(c)三者的函数,点击价值是用户(u)和广告(a)的函数,可以认为与上下文(c)无关,因为用户已经跳到商品所在的页面了。
eCPM,点击率与点击价值之积是eCPM(expect CPM),它是非常重要的一个值。Return是每次eCPM的累加值。
不同的分解对应不同的市场形态。CPM市场:是固定的eCPM,由媒体和代理商结算,是由代理商自己估算展示的价值,风险是在Demand方,这种方式对媒体有利。这种方式对品牌广告有一定优势,因为品牌广告受到广告影响是一个长期的过程,很难估算ROI。CPC市场:它是将ROI分成点击率和点击价值,广告系统负责估计点击率,而广告主负责估计点击价值。广告主只需要告诉广告系统一次点击的价值是多少。
课时9 在线广告系统模块
搭建一个广告系统有以下几个重要组成部分:
-
高并发的投送系统,即在线的AdServer,它通过请求中的user和context信息来决定展示哪些ads。它的特点是高并发,要做到10ms级别的实时决策,百亿次/天的广告投放系统。
-
受众定向平台,它进行离线的数据挖掘分析,一般要用到Hadoop。比如进行点击率预测的分析。
-
数据高速公路,它是联系在线与离线的部分,它比较简单,可以用开源工具实现,它的作用是准实时地将日志推送到其它平台上,目的一是快速地反馈到线上系统中,二是给BI人员快速看结果。它还可能收集其它平台的日志,比如搜索广告会收集搜索日志。
-
流式计算平台,它是比Hadoop快的一个准实时分析平台,它要实现的功能:反作弊,计价,实时索引。
ad serving:ad call的产生一是用户直接产生,二是通过exchange过来。
retrieval:根据ad call的实际情况找到符合定位情况的广告
ranking:准则是eCPM
session log generation:定位要根据用户行为来决定,这个LOG就是将某用户一天的行为写成一份日志,成为算法的基础。
log提供给data warehouse 或BI,BI是数据和人的接口,根据人的需求提供差别性的查询报表。
session log也可以做受众定向,还可以做点击率模型,进行预算,计算eCPM,供ranking使用
page fetcher: 广告不需要全网的爬虫,只需要有广告投放的页面。会爬出有广告投放的attribution(标签)。标签为广告的retrieval服务。
customized audience segmentation: 广告比较独特的一点。很多时候媒体划分的人群等分类与广告主的分类需求差别很大,这就需要为广告主个性化的分类的服务。广告主的信息要注入到媒体当中。
RTBD和RTBS:前者是自己实时向别人做ad call,这样自己就是一个exchange,而后者是别人向我做ad call,我根据ad call向DSP询价。这两者是RTB的两个方面。