课程地址:计算广告学
课时18 数据加工和交易
有价值的数据
- 用户标识
用户标识是最有价值的数据,在广告系统中如果定位一个用户一般是用cookie,但也有更强的方式,有登录的网站,它的效果就cookie就强。腾讯有QQ号做支撑,效果就会非常好。用户标识的效果可以通过多家第三方ID绑定不断优化。
- 用户行为
业界公认有效行为数据(按有效性排序):“交易,预交易,搜索广告点击,广告点击,搜索,搜索点击,网页浏览,分享,广告浏览”,需要注意的是网页浏览是一个被动行为,热点话题应该去掉。越靠近demand的行为对转化越有贡献,越主动的行为越有效。
- 广告商(Demand)数据
如果对广告效果来讲,它是数据的核心。简单的cookie植入可以用于retargeting。对接广告商种子人群可以做look-alike,提高覆盖率。
- 用户属性和精确地理位置
非媒体广告网络很难获取,需通过第三方数据对接。移动互联和HTML5为获得地理位置提供了便利性。
- 社交网络
实名社交网络的人口属性信息相对准确,当一个用户的属性未知时,可以通过好友关系链推测出他的用户属性。
数据管理平台(Data Management Platform)
DMP有几项主要的业务功能:
-
为网站提供数据加工和对外交易能力,即将网站的数据管理起来,加工成标签,标签给网站使用,也可以出售。
-
只加工单个网站的数据,标签更准确,这种标签在交易市场中是有公司有兴趣购买的。
DMP的关键特征有:
-
定制化用户划分,DMP自己加工用户标签是因为它可以针对不同的网站加工不同的标签。
-
统一的对外数据接口
DMP在架构中的位置在图中已经标出,它主要是运行一个Data Highway,把各种各样的数据收集起来,比如它对接了十家媒体,那么十家媒体的数据都通过它的Data Highway到计算平台上,它做两件事,1.做Audience Targeting,即给用户打标签,2. 将标签放在在一些可以对外售卖的体系中,比如AdExchange中。它也可以对上下文提供标签,它属于离线挖掘的部分,作用是综合各网站的数据为主。
Data Highway工具
个人工作中常用的是Facebook的Scribe这个Data Highway,它提供大规模分布式日志收集功能,比如服务器会产生多种日志,广告投放系统日志,点击日志,我们希望可以在几分钟内收集到这些日志流到Hadoop或是Storm上,进行数据挖掘,我们可以用Scribe。它可以准实时收集大量日志到HDFS,得用Thrift实现底层服务。