股票代码
02556.HK
当前位置: 首页 > 行业热点 > 盘点电商数据统计中较为易犯的错误

盘点电商数据统计中较为易犯的错误

来 源:http://www.trueland.net/ 发布时间:2014-01-27 16:53:22 点击次数:64648

 

  当进入大数据时代,网站运营越来越需要会数据解读的人才,尤其是在电商领域。一份正确的数据解读报告可以帮助企业主有目的性、方向性的完成决策。但往往也有很多人在比较简单的统计学基础概念上犯错误,以下是几个大家较为容易犯的错误。

  1、 只看平均数

  平均数是大家使用比较普遍的数据模型。但在概率统计学上,算数平均数有一个较为致命的缺点——受极值影响大。举个很形象的例子,5个人年薪分别为5万、10万、2万、500万、8万,算平均数,人均年薪为105万,这是一个完全失真,没有实际代表意义的数字,出现这个的原因就是受极值影响。

  为了避免极值的影响,很多人会选用去掉大值和小值的方法,但这个方法略显粗暴,不够科学。那么我们应该怎么做才能更科学的做出数据分析呢?以下几个数据模型值得参考。

  中位数,是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位。上例中的8万即为中位数(若数列值为偶数,则取中间两个数的平均值),这个数值显然比105万要有代表意义。

  众数,指一组数据中出现次数较多的数值,有时众数在一组数中有好几个。在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。

  几何平均数,是指n个观察值连乘积的n次方根。依然利用上例,得出几何平均数为15万,比起单纯的算数平均数,误差要小得多。

  因而建议网站的数据分析人员在进行数据统计分析的时候,不妨多选用几种方法,对比后结果,用以帮助判断数据的准确性。这几个数据模型都可以通过excel的函数轻松实现,MEDIAN(中位数)、MODE(众数)和GEOMEAN(几何平均数)。

  2、 忽视定基比率

  一般而言,在比较数据的变化幅度时比较常用的模型是环比增长率和同比增长率。环比增长率,是指和上期相比较的增长率。普遍的计算公式是环比增长率=(本期的某个指标的值-上一期这个指标的值)/上一期这个指标的值*100%。环比增长率可以反映出指标变化的连续性和动态性。

  同比增长率,一般是指和去年某一个同期相比较的增长率。同比增长和上一时期、上一年度或历史相比的增长(幅度)。计算公式为:同比增长率=(当年的指标值-去年同期的值)÷去年同期的值*100%。同比增长率排除了季节性的因素,可以反映出实质性的增长。但是,即便如此,这两个数据模型也有着明显的缺陷。倘若不同年份间市场行情差异巨大,那么同比就失去了参照意义。而环比只能表现出本期和上期的区别,若相隔期数多了,就很难判断现状。

  面对上述问题,我们可以引进定基动态比率。定基动态比率是指以某一时期的数额为固定基期数额而计算出来的动态比率。其计算公式为:定基动态比率=分析期数额/固定基期数额×100%。相比较前两种数据模型,定基动态比率更能反应出一段时间内的经营成效。

  3、 重视绝对数值,忽视四分位数

  我们常常会很在意某件单品在总的销售额间的排名,如果某款产品排在第八位,那么在50款产品中,它的排名就是16%,而在100款产品中,它的排名就是8%。这就是绝对数字排名带来的陷阱。

  一般而言,四分位数中的25%、50%、75%三个点是需要重视的特殊点,这是评判指标优劣的一个标准。比如某件单品排名或是业务转化率在25%内浮动,那么网站运营的现状就可以归结为无需过多担心,保持稳定即可。如果低于25%,则需要考虑是否需要采取相应的措施借以改变现况。

  4、单纯追求数据的增长,忽略成本的稳定性

  年终业绩盘点,很多人都希望自己交出去的报表都有好看的的增长曲线。但很多电商往往出现销售量高增长的同时,企业成本曲线也相应的增长。对于企业来说,无论是基于财务健康还是业务可持续而言,这都是非常不可取的做法。成本的稳定性是企业成长的内蓄力。

  通常我们会采用方差来计算数据的稳定性,一般而言,方差越大,表示该指标稳定性越差。在excel中可以用VAR函数。

  对于一个运转健康的企业而言,销售额的变化,对成本影响不应该非常大。即在计算方差时,方差数值应该较小。方差的稳定性指标在衡量采购成本、推广费用、物流费用等等信息时非常具有警示意义。

  以上是几个较为基础但也是进行数据分析较为容易忽视的要点,整理出来,希望能帮助大家更好地利用数据。


相关资讯

您的业务有难题?请及时联系我们!

我们拥有各领域专业的解决方案顾问,为您解答任何业务上的困惑,或是
交流行业最新方向动态,期待与您愉快的交流。

免费咨询