Google Analytics实战指南:自定义自然搜索来源

Google Analytics(特指Universal Analytics),默认情况下对于中国的(或者说本土化的)搜索引擎识别并未不全面,在默认情况下,如果你不进行额外的配置,则这些未被识别的搜索引擎流量会被计算为引荐来源。

在新版本的GA中,我们并不需要像老版本的那样去添加额外的跟踪代码,我们只需要在设置中心进行设置即可,非常的方便。

在进入配置之前,我们首先要了解一个流量来源的识别机制。我们可以细化成来源和媒介。

来源顾名思义就是用户从哪里来的。GA会将来源信息进行精简,比如只显示引荐网址的主域名,搜索引擎的名称等。

GA判断媒介的唯一根据便是请求数据中的完整引荐网址(即document.referrer)

  1. 如果该引荐网址不存在,则被判定为直接流量(none)
  2. 如果引荐来源中带有cpc这种特定的标识参数或者带有AdWords随机生成的广告标记,则会判定为付费搜索(cpc)
  3. 如果是来自某个系统可识别的搜索引擎,并且未添加参数标记且未启用adwords的自动标记,则会被识别为自然搜索(organic)
  4. 如果使用了网址构建器添加相应的参数,则是添加的参数(如utm_medium=cpm)
  5. 其他非空值则为(referral)

那么,我们如何来检验当前流量的来源和媒介呢?

  1. 使用Chrome浏览器,打开网站,按下F12,选择network的选项卡。
  2. 查找collect?这个请求,点击打开,你会看到类似这种字符串,其中的utmcsr即代表来源,而utmcmd则代表媒介,utmcsr%3D(direct)%7Cutmccn%3D(direct)%7Cutmcmd%3D(none)

如果你觉得这样有点太麻烦或者太难了,查看实时报告也是一个不错的方法。

另外,Chrome浏览器也有一些扩展程序可以很方便地帮助我们了解当前流量的来源/媒介,比如Google Analytics Debugger,安装后按下F12打开console选项卡即可看到被解析出来的数据。

上面这些方法经常应用于我们对异常数据的模拟和检测,或者测试数据,有必要参考去实践一下。

如何自定义自然搜索来源?参照帮助中心的这篇文章即可,最后设置完的效果如下图所示,你可能需要根据引荐来源中未被正确识别的流量进行一些调整:

organic search sources

Google Analytics实战指南:序言

将博客迁移到了Linode(欢迎使用推荐码:6226223ca39970b7ee1b06b3c79015a9b80aef88),这段时间也大概地学了些Linux基本知识,加上工作繁忙,暂停了更新,现在重新开始。

进入正题,《Google Analytics实战指南》系列文章,关于Google Analytic的一些经验总结和学习心得。

首先,看到这篇文章说明你做了一个明智的选择,Google Analytics(以后简称GA)是一个免费的数据分析工具,但是其功能在大多数情况下并不逊色于大多数的商业分析工具,并且如果你真正掌握了GA,学习其他分析工具也会很快。

我们这里不谈国内的流量统计工具,这些都不是真正意义上的分析工具,目前还只是停留在流量统计层次,落后了不知道几条街。其他的工具,你可能暂时没有机会能用上,动辄十几万的工具使用费毕竟不是每个公司都能承受的,新人可能也很少有机会能接触到。

其次,学习GA的最好方法是实践。推荐每个有志成为数据分析师的同学都建立一个个人网站,一年百来块钱的成本远比你啥都不懂去上动辄千元的培训课程更有价值和意义。通过自己的不断折腾,你将会了解到代码部署的基本方法,了解到趋势对比这种基本的分析方法,了解到不同指标的权威定义。

如果你很细心,会发现很多看起来很奇怪的数据,而如果你对这些奇怪的现象进行深入了解和分析,你已经具备了数据分析师的基本精神:怀疑、探索和发现。同时,也能进一步加深对数据的理解。

实践并不代表凡事身体力行,毕竟不是每个人都是技术出身,在公司做数据分析,你可能需要跟技术人员进行深入沟通,让他们帮你部署代码,而你则需要整理好相关文档,将最终要实现的效果告诉他。尽可能多了解一些编程技术也是加分项,比如最基础的html和javascript,以及基本的PHP等。

再次,帮助中心是最好的学习教材(没有之一)。有志于深入学习GA的同学,花点时间学完帮助中心的内容,学完之后你的理论储备将会有质的飞跃,在理解的基础上进行一定的实践操作,完了拿下GAIQ个人认证证书应该是没有太大问题了。

最后,请不要沉迷于分析工具本身,自我陶醉于自己的各种高级设置和代码部署。工具必须服务于你的分析需求,一定要清楚地认识到自己的分析目的,然后围绕这个目标进行后台配置、代码部署、报告定制。千万不能因为别人这么做了,你也这样做,独立思考非常重要。

以下,我们先在WordPress博客程序当前主题的header.php的</head>前加上GA提供的默认跟踪代码,算是开始了,未完待续。

<script>
  (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
  (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
  m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
  })(window,document,'script','//www.google-analytics.com/analytics.js','ga');

  ga('create', 'UA-45111607-1', 'auto');
  ga('send', 'pageview');

</script>