Shanshan Pythoner Love CPP

计算广告学 笔记3.5 数据加工和交易

2017-04-09
Ad

课程地址:计算广告学

课时18 数据加工和交易

有价值的数据

  • 用户标识

用户标识是最有价值的数据,在广告系统中如果定位一个用户一般是用cookie,但也有更强的方式,有登录的网站,它的效果就cookie就强。腾讯有QQ号做支撑,效果就会非常好。用户标识的效果可以通过多家第三方ID绑定不断优化。

  • 用户行为

业界公认有效行为数据(按有效性排序):“交易,预交易,搜索广告点击,广告点击,搜索,搜索点击,网页浏览,分享,广告浏览”,需要注意的是网页浏览是一个被动行为,热点话题应该去掉。越靠近demand的行为对转化越有贡献,越主动的行为越有效。

  • 广告商(Demand)数据

如果对广告效果来讲,它是数据的核心。简单的cookie植入可以用于retargeting。对接广告商种子人群可以做look-alike,提高覆盖率。

  • 用户属性和精确地理位置

非媒体广告网络很难获取,需通过第三方数据对接。移动互联和HTML5为获得地理位置提供了便利性。

  • 社交网络

实名社交网络的人口属性信息相对准确,当一个用户的属性未知时,可以通过好友关系链推测出他的用户属性。

数据管理平台(Data Management Platform)

DMP有几项主要的业务功能:

  • 为网站提供数据加工和对外交易能力,即将网站的数据管理起来,加工成标签,标签给网站使用,也可以出售。

  • 只加工单个网站的数据,标签更准确,这种标签在交易市场中是有公司有兴趣购买的。

DMP的关键特征有:

  • 定制化用户划分,DMP自己加工用户标签是因为它可以针对不同的网站加工不同的标签。

  • 统一的对外数据接口

DMP在架构中的位置在图中已经标出,它主要是运行一个Data Highway,把各种各样的数据收集起来,比如它对接了十家媒体,那么十家媒体的数据都通过它的Data Highway到计算平台上,它做两件事,1.做Audience Targeting,即给用户打标签,2. 将标签放在在一些可以对外售卖的体系中,比如AdExchange中。它也可以对上下文提供标签,它属于离线挖掘的部分,作用是综合各网站的数据为主。

Data Highway工具

个人工作中常用的是Facebook的Scribe这个Data Highway,它提供大规模分布式日志收集功能,比如服务器会产生多种日志,广告投放系统日志,点击日志,我们希望可以在几分钟内收集到这些日志流到Hadoop或是Storm上,进行数据挖掘,我们可以用Scribe。它可以准实时收集大量日志到HDFS,得用Thrift实现底层服务。


Similar Posts

Comments

Content