课程地址:计算广告学
课时28 搜索广告
搜索广告的特点:1. 用户定向标签f(u):远远弱于上下文影响,一般可以忽略,但是因为搜索广告中query的信息已经很强了,用query已经足够了。2. Sesion内的短时用户搜索行为作用很重要,3. 上下文定向标签f(c):关键词。 查询词扩展 从缺点来讲,是搜索广告的运营商希望通过查询词扩展以攫取更多的利润。 做查询扩展后的广告点击的价值是要低于不做查询扩展的点击价值,但如果扩展的关键词相关的广告如果出价更高或一样高,那么对搜索广告运营商做扩展是会收入更多的。另一点从宏观上讲,通过做查询扩展,使得每一个广告主的竞价范围变大了。 方法:
- 基于推荐的方法,它是挖掘(session,query)矩阵找到相关query,session就是用户在一次查询序列中输入的查询词,可以用推荐技术中挖掘(user, item)的算法进行挖掘,这种方法利用的是搜索数据。
- 基于语义的方法,用topic model或概念化的方法中找语义相关query,对相同主题的词用topic model进行聚类,并认为它们的相似的查询意图,经过一些选择,可以将它们列到查询扩展集合中。Topic model是分析潜在语义的模型,也可以一些明确语义分析方法,它是将一些词或词组抽象成数目相对少的概念,每个概念中的词可以认为它们有相似的意图。语义分析的方法利用的是其它文档的数据。
- 基于收益的方法,这种方法在实际中效果是很好的,它不进行语义的分析,也不进行推荐分析,仅看一个查询词在历史上哪些查询词对它的eCPM变现高,但它的分析出来的数据量是很少的,一些新词和长尾的词它就无能为力了,但它是不会漏掉一些真正有经济价值的词。 用户相关的搜索广告决策
- 结果个性化对于搜索广告作用有限,前面提到过f(u)直接做audience 兴趣的targeting的意义并不大,因为上下文信息(c)太强,个人兴趣可以忽略。
- 广告展示的条数可以深度个性化,即参与position auction的位置的个数。
- 可以根据同一session内的行为调整广告结果,比如:用户在第一页没有点击任何广告,用户点击第二页时,可以不再展示第一页展示过的广告。 短时用户行为反馈 短时内用户的几次连续搜索称之为一个session,session的行为可以更明确地标定他搜索的目标。 在广告系统中,短时用户行为有两个作用,1. 短时的受众定向:根据短时行为为用户打上标签。因为短时的计算不太可能用Hadoop这样的平台进行计算,因为Hadoop平台有很长的延时,并且处理时间也不能确定。所以这个打标签的过程是与其它标签的过程是独立的。2. 短时点击反馈:根据短时广告交互计算的动态特征。 所以它可以利用流式计算(stream computing)平台,比如S4,Storm等进行计算
课时29 流式计算平台
在Storm中,一个实时应用的计算任务被打包作为Topology发布,这同Hadoop的MapReduce任务相似。流式计算是调度数据的,而Hadoop核心是调度计算
课时30 广告购买平台
广告购买平台(trading desk):链接不同媒体和广告网络,不能提供非实时的ROI广告网络Demand端。
广告购买平台(Trading Desk)
- 产品目标:Allows advertisers buy audience across publishers and ad networkds
- 关键特征: 连接到不同媒体和广告网络,为广告商提供universal marketplace
非实时竞价campaign的ROI优化能力 经常由代理公司孵化出来