Shanshan Pythoner Love CPP

计算广告学 笔记1 广告的基本知识

2017-04-06
Ad

课程地址:计算广告学

课时1 广告的目的

广告,推荐,搜索,这三个领域我们称为wide scale challenge(大规模数据挑战)。广告中文字推荐高于图片广告 但对于推荐系统图片广告高于文字广告

“广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。” —— 广告(Advertising)的定义来自于阿伦斯的《现代广告学》。

  • 广告的主体:广告主(advertiser),媒介(medium),受众(audience)

  • 本质:借助某种广泛受众的媒介的力量,完成较低成本的用户接触(reach)

品牌广告和效果广告

  • 品牌广告(Brand Awareness):目的在于提升较长时期内的离线转换率。能够为企业长期带来利润空间。

  • 效果广告(Direct Response):有短期内明确用户转化行为诉求的广告。

课时2 广告的有效性模型

  • 曝光:它是指广告是否被用户所看到,它是由广告位的天然属性所决定,无法通过算法的方式进行优化。

  • 关注(attention)是指用户在看到广告后,是否注意到这个广告。可通过算法优化

  • 理解是指用户的确理解广告的内容

  • 信息接受是指用户理解广告的内容,并认同广告中的内容。

  • 保持是指在相当长的时间内,都能想起一个品牌,并可能购买这个品牌的商品。

  • 购买的效果取决于是否在用户的价格敏感接受范围

对广告有两点基本的评价指标,点击率后续的转化率

课时3 广告与营销的差别

两者的区别是广告主要针对的是潜在用户,而销售是针对对商品有明确需求的人。

广告的目的是通过媒介传播企业形象或产品信息,而销售的目的是提升产品销量。 广告的效果是特定人群的有效reach,而销售的效果是收入和利润。

课时4 在线广告的特点

在线广告的特点

  • 技术和计算导向: 在线广告和线下广告产品运行的形态有很大不同,在线广告一直在被技术和产品驱动,与之相对的线下广告是被创意和客户关系驱动。数字媒体的特点使在线广告可以进行精细的受众定向,即对不同的用户推荐不同的广告。技术使得广告决策和交易朝着计算驱动的方向发展,计算已经成为广告中主导的部分,而商业逻辑作为辅助的部分。

  • 可衡量性:广告的点击是广告效果的直接收集途径,可以很直接地从点击率中看到广告的效果。

  • 标准化:技术投放和精准定向促进了在线广告的标准化

课时5 在线广告市场

第三个阶段:Supply产生了广告交易的平台,就是AdExchange,Demand方对应产生了DSP(Demand Side Platform)。

Supply有三种技术变现的方式:

  • 托管给Ad Network,比如,一个网站有一个广告位,它可以在AdSense里注册这个广告位,即托管给AdSense,AdSense的下游是Automated Trading Desk(ATD),ATD从多个AdExchange中买流量,并有优化ROI的功能。

  • 托管给广告交易市场,即托管给AdExchange。比如google display network会将它竞价比较低的流量导给AdExchange,让AdExchange进行实时竞价,实时竞价的好处是一些小的流量可能会以比较高的价格卖出。AdExchange会接受DSP的出价,而DSP与Agency是一起的。

  • SSP(Supply Side Platform)。它产生的原因是AdSense这些网站是优化自己广告平台的营收,而不是网站的营收,而网站当然有优化自己营收的诉求,而SSP就是站到媒体的利益方来设计优化方案。

课时6 计算广告核心问题和挑战

公式中a表示Sponsor(advertiser),c表示媒体(context),u代表受众(user)。公式的含义是:给定user,给定context,选择一组ad,使得ROI最高。

从优化角度看它涉及:

  • 特征提取:受众定向,即把u和c打上标签的过程。

  • 微观优化:对一次展示进行优化,得到最好的广告,最关键的技术是CTR预测。

  • 宏观优化:因为在线广告是用户,媒体,广告商三方博弈,所以竞价市场机制的设计非常重要。

  • 受限优化:在量一定的情况下,怎么来优化质,在线分配就是这个问题。

  • 强化学习:如何知道在新的广告主或新的用户群预测它的点击率,很直觉的想法是尝试,分配一定的流量给广告,看是男性用户点击率高还是女性。但是在尝试的过程中会损失一部分收入,因为不是按最优策略出广告的了。尝试的过程即探索,使用探索的结果即利用。

  • 个性化重定向。

从系统角度涉及:

  • 候选查询:要使用实时索引技术,使广告能很快地进入索引,很快指两个方面,新的广告要能尽快上线,广告预算用完的广告要尽快下线。

  • 特征存储:在线高并发要用到一些No-Sql技术。

  • 离线学习:很多时候要用到Hadoop。

  • 在线学习:一些比较快的反馈,比如得到用户上一个搜索词,要用到流计算技术。

  • 交易市场:要用到实时竞价。

在线广告计算的主要挑战有:

  • 大规模(Scale):线投放系统中的高并发挑战 (例: Rightmedia每天处理百亿次广告交易,它会向多个DSP去请求,即每天要进行千亿次的请求),响应速度在常见的web应用中可能是最高的。

  • 动态性(Dynamics):需要所建立的模型支持快速变化,比如涉及到CTR预测,那么模型参数是否能快变,特征是否能快速改变都是有挑战的。

  • 丰富的查询信息 (Rich query)

  • 探索与发现 (Explore & exploit):用户反馈数据局限于在以往投放中出现过的(a, u, c)组合,需要主动探索未观察到的领域,以提高模型正确性。

课时7 广告,搜索和推荐的比较

广告明显比搜索容易部分的是不需要复杂的爬虫技术和PageRank。而它比搜索困难的地方是它需要建模的数据量比搜索要大。搜索,广告与推荐三者的主要区别在于它们的准则不同,搜索主要是针对相关性,广告主要针对ROI。

推荐和广告比较大的区别是:推荐进行的是同质化的推荐,另外推荐还有优化流(downstream)的概念,比如用户在看新闻时,会根据推荐跳到另一个新闻页面,而在这个新闻页面上可以继续推荐,优化流是指优化整个根据推荐看新闻过程的点击率。而对于广告来讲,推荐出的广告点击后,就跳到目标页面了,就不可能有优化downstream的机会了。

课时8 投资回报ROI分析

点击率(CTR),点击率是用户(u),广告(a),上下文(c)三者的函数,点击价值是用户(u)和广告(a)的函数,可以认为与上下文(c)无关,因为用户已经跳到商品所在的页面了。

eCPM,点击率与点击价值之积是eCPM(expect CPM),它是非常重要的一个值。Return是每次eCPM的累加值。

不同的分解对应不同的市场形态。CPM市场:是固定的eCPM,由媒体和代理商结算,是由代理商自己估算展示的价值,风险是在Demand方,这种方式对媒体有利。这种方式对品牌广告有一定优势,因为品牌广告受到广告影响是一个长期的过程,很难估算ROI。CPC市场:它是将ROI分成点击率和点击价值,广告系统负责估计点击率,而广告主负责估计点击价值。广告主只需要告诉广告系统一次点击的价值是多少。

课时9 在线广告系统模块

搭建一个广告系统有以下几个重要组成部分:

  • 高并发的投送系统,即在线的AdServer,它通过请求中的user和context信息来决定展示哪些ads。它的特点是高并发,要做到10ms级别的实时决策,百亿次/天的广告投放系统。

  • 受众定向平台,它进行离线的数据挖掘分析,一般要用到Hadoop。比如进行点击率预测的分析。

  • 数据高速公路,它是联系在线与离线的部分,它比较简单,可以用开源工具实现,它的作用是准实时地将日志推送到其它平台上,目的一是快速地反馈到线上系统中,二是给BI人员快速看结果。它还可能收集其它平台的日志,比如搜索广告会收集搜索日志。

  • 流式计算平台,它是比Hadoop快的一个准实时分析平台,它要实现的功能:反作弊,计价,实时索引。

ad serving:ad call的产生一是用户直接产生,二是通过exchange过来。

retrieval:根据ad call的实际情况找到符合定位情况的广告

ranking:准则是eCPM

session log generation:定位要根据用户行为来决定,这个LOG就是将某用户一天的行为写成一份日志,成为算法的基础。

log提供给data warehouse 或BI,BI是数据和人的接口,根据人的需求提供差别性的查询报表。

session log也可以做受众定向,还可以做点击率模型,进行预算,计算eCPM,供ranking使用

page fetcher: 广告不需要全网的爬虫,只需要有广告投放的页面。会爬出有广告投放的attribution(标签)。标签为广告的retrieval服务。

customized audience segmentation: 广告比较独特的一点。很多时候媒体划分的人群等分类与广告主的分类需求差别很大,这就需要为广告主个性化的分类的服务。广告主的信息要注入到媒体当中。

RTBD和RTBS:前者是自己实时向别人做ad call,这样自己就是一个exchange,而后者是别人向我做ad call,我根据ad call向DSP询价。这两者是RTB的两个方面。


Similar Posts

Previous Scala Tutorial

Comments

Content